e-techbytes: OSCHINA 社区最新专区文章

Wednesday, April 27, 2022

OSCHINA 社区最新专区文章

国产化浪潮下TiDB解决的痛点问题
字节跳动构建Data Catalog数据目录系统的实践
安全业务全链路数据仓库在58的实践与应用
PostgreSQL 15：一些新特性
“一个扫描枪一张表”，韵达选择 TDengine 应对每日亿级数据量
Deep Dive 7：Milvus 2.0 质量保障系统详解
TiDB 查询优化及调优系列（二）TiDB 查询计划简介
TiFlash 源码阅读（一） TiFlash 存储层概览
揭秘华为云GaussDB(for Influx)：最佳实践之数据建模
解析数仓OLAP函数：ROLLUP、CUBE、GROUPING SETS
万字详解！搜狐智能媒体基于 Zipkin 和 StarRocks 的微服务链路追踪实践
MySQL对JOIN做了那些不为人知的优化？

Posted: 17 Mar 2022 02:06 AM PDT

1 前言随着国内互联网企业的快速发展，传统的oracle数据库架构在成本和扩展性上已不能满足要求，更多的企业将目光转向了开源的MySQL数据库，由于MySQL本身是一个单机数据库其本身并不具备横向扩展能力，于是出现了应用侧的分库分表方案。进一步的又开发出分库分表中间件，由中间件完成分库分表的管理，避免了应用侧的复...

字节跳动构建Data Catalog数据目录系统的实践

Posted: 24 Apr 2022 07:38 PM PDT

作为数据目录产品，Data Catalog 通过汇总技术和业务元数据，解决大数据生产者组织梳理数据、数据消费者找数和理解数的业务场景，并服务于数据开发和数据治理的产品体系。本文介绍了字节跳动Data Catalog系统的构建和迭代过程，将分为上、下篇发布。上篇主要围绕Data Catalog调研思路及技术架构展开。 **一、背景** **1....

安全业务全链路数据仓库在58的实践与应用

Posted: 25 Apr 2022 06:40 PM PDT

1 背景 "全链路"指的是全业务、全场景、全方向，那么全链路数据仓库指的是这个数仓中的数据是包罗万象的数据，因为在信息安全业务领域，会有大量的特征、策略、用户行为需要进行数据分析和验证，因此挖掘数据关系的关联性俨然成为了一个趋势，这些数据的链路关系是面向全方位的，两点之间的数据也可以存在多条链路关系...

PostgreSQL 15：一些新特性

Posted: 25 Apr 2022 12:53 AM PDT

PostgreSQL 15 版本正在开发中，不远的将来就会与大家见面，一起来看看未来的一些新功能吧！ 1. 删除public 模式的创建权限直到今天，使用 PostgreSQL 14，每个人都可以默认写入public模式。使用 PostgreSQL 15，这将受到限制。public模式现在由"pg_database_owner"拥有。让我们做一个简短的测试。 postgres=# creat...

“一个扫描枪一张表”，韵达选择 TDengine 应对每日亿级数据量

Posted: 25 Apr 2022 02:30 AM PDT

小 T 导读：此前，韵达使用 MySQL 分区+索引处理订单数据的方式遭受到了挑战，面对每日亿级的数据量，MySQL 显然已经无法满足当下的数据处理需求。为更好地发展业务，在此基础上韵达新增了 TDengine 的数据源，用专业的数据库来进行时序数据的处理。作为一家头部物流公司，韵达每日的订单扫描量能达到上亿级，这也是目前...

Deep Dive 7：Milvus 2.0 质量保障系统详解

Posted: 21 Apr 2022 04:00 AM PDT

编者按：本文详细介绍了 Milvus 2.0 质量保障系统的工作流程、执行细节，以及提高效率的优化方案。质量保障总体介绍测试内容的关注点开发团队与质量保障团队如何协同 Issue 的管理流程发布标准测试模块介绍总体介绍单元测试功能测试部署测试可靠性测试稳定性和性能测试提效方法和工具 Github Action 性能测试...

TiDB 查询优化及调优系列（二）TiDB 查询计划简介

Posted: 26 Apr 2022 07:21 PM PDT

「TiDB 查询优化及调优」系列文章将通过一些具体的案例，向大家介绍 TiDB 查询及优化相关的原理和应用，在上一篇文章中我们简要介绍了 TiDB 查询优化器的优化流程。查询计划（execution plan）展现了数据库执行 SQL 语句的具体步骤，例如通过索引还是全表扫描访问表中的数据，连接查询的实现方式和连接的顺序等。查阅...

TiFlash 源码阅读（一） TiFlash 存储层概览

Posted: 26 Apr 2022 07:58 PM PDT

背景本系列会聚焦在 TiFlash 自身，读者需要有一些对 TiDB 基本的知识。可以通过这三篇文章了解 TiDB 体系里的一些概念《说存储》、《说计算》、《谈调度》。今天的主角 -- TiFlash 是 TiDB HTAP 形态的关键组件，它是 TiKV 的列存扩展，通过 Raft Learner 协议异步复制，但提供与 TiKV 一样的快照隔离支持。我们...

揭秘华为云GaussDB(for Influx)：最佳实践之数据建模

Posted: 25 Apr 2022 08:11 PM PDT

摘要：本期将从GaussDB(for Influx)数据模型谈起，分享GaussDB(for Influx)数据建模的最佳方法，避免一些使用过程中的常见问题。本文分享自华为云社区《华为云GaussDB(for Influx)揭秘第七期：最佳实践之数据建模》，作者： GaussDB 数据库。华为云GaussDB(for Influx)时序数据库面向工业物联网海量时序数据场景提供数...

解析数仓OLAP函数：ROLLUP、CUBE、GROUPING SETS

Posted: 26 Apr 2022 08:46 PM PDT

摘要：GaussDB(DWS) ROLLUP，CUBE，GROUPING SETS等OLAP函数的原理解析。本文分享自华为云社区《GaussDB(DWS) OLAP函数浅析》，作者： DWS_Jack_2。在一些报表场景中，经常会对数据做分组统计（group by），例如对一级部门下辖的二级部门员工数进行统计： create table emp( id int, --工号 name text, --员工名...

万字详解！搜狐智能媒体基于 Zipkin 和 StarRocks 的微服务链路追踪实践

Posted: 28 Mar 2022 12:23 AM PDT

作者：翟东波、叶书俊在微服务体系架构下，搜狐智能媒体使用 Zipkin 进行服务链路追踪（Tracing）的埋点采集，将采集的 Trace 信息存储到 StarRocks 中。通过 StarRocks 强大的 SQL 计算能力，对 Tracing 信息进行多维度的统计、分析等操作，提升了微服务监控能力，从简单统计的 Monitoring 上升到更多维度探索分析的 ...

MySQL对JOIN做了那些不为人知的优化？

Posted: 25 Apr 2022 06:37 PM PDT

大家好，我是咔咔不期速成，日拱一卒通过上期文章知道了在MySQL中存在三种join的算法，分别为NLJ、BNLJ、BNL，总结来说分为索引嵌套循环连接、缓存块嵌套循环连接、粗暴循环连接。另外还知道了一个新的概念join_buffer，作用就是把关联表的数据全部读入join_buffer中，然后从join_buffer中一行一行的拿数据去被驱动表...

e-techbytes

Wednesday, April 27, 2022

OSCHINA 社区最新专区文章

OSCHINA 社区最新专区文章

No comments:

Post a Comment