Thursday, December 16, 2021

OSCHINA 社区最新专区文章

OSCHINA 社区最新专区文章


备份的 “算子下推”:BR 简介丨TiDB 工具分享

Posted: 15 Dec 2021 06:26 PM PST

BR 选择了在 Transaction KV 层面进行扫描来实现备份,这样,备份的核心便是分布在多个 TiKV 节点上的 MVCC Scan:简单,粗暴,但是有效,它生来就继承了 TiKV 的诸多优势:分布式、利于横向拓展、灵活(可以备份任意范围、未 GC 的任意版本的数据)等等优点。 相较于从前只能使用 mydumper 进行 SQL 层的备份,BR 能够更...

更强大、更灵活、更全面丨一文搞懂DolphinDB窗口计算

Posted: 13 Dec 2021 11:34 PM PST

在时序数据的处理中经常需要使用窗口计算。在DolphinDB中,窗口计算不仅仅应用于全量的历史数据计算,还可以应用于增量的流计算。窗口函数既可应用于SQL(处理表中的列),也可应用于面板数据(处理矩阵中的列)。DolphinDB对于窗口计算进行了精心优化,与其它系统相比,拥有显著的性能优势。除此之外,DolphinDB的窗口函...

从一次 SQL 查询的全过程看 DolphinDB 的线程模型

Posted: 15 Dec 2021 06:53 PM PST

分布式系统较为复杂,无论写入还是查询,都需要多个节点的配合才能完成操作。本教程以一个分布式 SQL 查询为例,介绍 DolphinDB 分布式数据库的数据流以及其中经历的各类线程池。通过了解 SQL 查询的全过程,也可以帮助我们更好地优化 DolpinDB 的配置和性能。 1. DolphinDB 线程类型 woker 常规交互作业的工作线程,用于...

JuiceFS 缓存策略详解

Posted: 15 Dec 2021 08:18 PM PST

对于一个由对象存储和数据库组合驱动的文件系统,缓存是本地客户端与远端服务之间高效交互的重要纽带。读写的数据可以提前或者异步载入缓存,再由客户端在后台与远端服务交互执行异步上传或预取数据。相比直接与远端服务交互,采用缓存技术可以大大降低存储操作的延时并提高数据吞吐量。 ## 数据一致性 JuiceFS 提供「关...

CurveFS预览版重磅首发,Curve加速迈向云原生软件定义存储

Posted: 15 Dec 2021 06:03 PM PST

今天,我们很高兴地发布Curve项目的文件系统,以及全新的部署工具。这也是CurveFS的第一个beta版本,预示着在Curve社区同仁的共同努力之下,Curve距离更好用的云原生软件定义存储又前进了一步。 版本地址: https://github.com/opencurve/curve/releases/tag/v0.1.0-beta 2021年上半年Curve团队立项决定做分布式共享文件...

InnoDB学习(五)之MVCC多版本并发控制

Posted: 14 Dec 2021 10:01 PM PST

MVCC多版本并发控制,是一种数据库管理系统并发控制的方法。MVCC多版本并发控制下,数据库中的数据会有多个版本,分别对应不同的事务,从而达到事务之间并发数据的隔离。MVCC最大的优势是读不加锁,读写不冲突,在读多写少场景中,读写不冲突可以大幅提升数据库的并发性能。 # MVCC多版本并发控制 在MYSQL中,MyISAM存储...

TiDB 故障诊断与性能排查:发生即看见,一切可回溯,Continuous Profiling 应用实践

Posted: 14 Dec 2021 05:25 PM PST

在企业遭遇的 IT 故障中,约有 30% 与数据库相关。当这些故障涉及到应用系统、网络环境、硬件设备时,恢复时间可能达到数小时,对业务连续性造成破坏,影响用户体验甚至营收。在复杂分布式系统场景下,如何提高数据库的可观测性,帮助运维人员快速诊断问题,优化故障处理流程一直是困扰着企业的一大难题。 一次海量数据场...

基于知识图谱的PostgreSQL深度分析

Posted: 14 Dec 2021 07:31 PM PST

本文是老白在1月16日PG中国大会上的演讲内容,全文有4500多字,阅读时间可能超过10分钟,请慎重阅读。 各位PG Funs下午好,我是老白。在疫情下2021 PG大会能够顺利进行十分不易。看到第二天下午的四点多钟,会场的上座率这么高,看得出PGer的热情十分高涨。可能认识老白的人会觉得奇怪,你不是混Oracle圈子的吗?怎么到P...

MySQL模糊查询再也不用like+%了

Posted: 13 Dec 2021 05:25 PM PST

前言 我们都知道 InnoDB 在模糊查询数据时使用 "%xx" 会导致索引失效,但有时需求就是如此,类似这样的需求还有很多,例如,搜索引擎需要根基用户数据的关键字进行全文查找,电子商务网站需要根据用户的查询条件,在可能需要在商品的详细介绍中进行查找,这些都不是B+树索引能很好完成的工作。 通过数值比较,范围过滤等...

2021年12月国产数据库排行榜: openGauss节节攀升拿下榜眼,GaussDB与TDSQL你争我夺各进一位

Posted: 14 Dec 2021 12:10 AM PST

2021年12月的[国产数据库流行度排行榜](https://www.modb.pro/dbRank?1214)已在[墨天轮](https://www.modb.pro/?1214)发布,本月共有189家数据库参与排名。为使国产数据库排名更加专业与客观,本月起,排行榜加入了三方评测、生态、专利数、论文数等新的指标。其中三方测评方面,在原信通院大数据产品能力评测的基础上,...

深度揭秘openGauss分区表如何实现大数据量的快速转移

Posted: 10 Dec 2021 02:00 AM PST

随着现代信息数据的快速增长,数据库的数据量也不断增长。对于庞大的数据如何管理呢?从数据库角度看,分区表无疑是一种很好的选择。 对于很多业务,只会访问最近几天或几个月的数据,对于之前的数据很少甚至几乎不访问,这就形成了热数据和冷数据。使用分区表可以隔离开热数据和冷数据,加快访问速度。最典型的就是按照...

No comments:

Post a Comment