Monday, May 30, 2022

OSCHINA 社区最新专区文章

OSCHINA 社区最新专区文章


百亿级数据同步,如何基于 SeaTunnel 的 ClickHouse 实现?

Posted: 05 May 2022 08:46 PM PDT

作者 | Apache SeaTunnel(Incubating) Contributor 范佳 整理 | 测试工程师 冯秀兰 对于百亿级批数据的导入,传统的 JDBC 方式在一些海量数据同步场景下的表现并不尽如人意。为了提供更快的写入速度,Apache SeaTunnel(Incubating) 在刚刚发布的 2.1.1 版本中提供了 ClickhouseFile-Connector 的支持,以实现 Bulk load ...

基于信息检索和深度学习结合的单元测试用例断言自动生成

Posted: 26 May 2022 12:06 AM PDT

摘要:本章节介绍基于IR的方法(包括基础的信息检索技术IRar以及自动适配技术RAadapt)和结合的方法。 本文分享自华为云社区《基于信息检索和深度学习结合的单元测试用例断言自动生成》,作者:华为云软件分析Lab 。 一、背景介绍 单元测试用来验证软件基本模块的准确性。跟其他层次的测试(比如集成测试和系统测试)相比...

带你学习MindSpore中算子使用方法

Posted: 26 May 2022 07:26 PM PDT

摘要:本文分享下MindSpore中算子的使用和遇到问题时的解决方法。 本文分享自华为云社区《【MindSpore易点通】算子使用问题与解决方法》,作者:chengxiaoli。 简介 算子的调用是构建模型的基础,准确的找到能满足需求的算子并能正确的使用,可以有事半功倍的效果。本次就分享下MindSpore中算子的使用和遇到问题时的解决...

理“ Druid 元数据”之乱

Posted: 29 May 2022 06:17 PM PDT

vivo 互联网大数据团队-Zheng Xiaofeng 一、背景 Druid 是一个专为大型数据集上的高性能切片和 OLAP 分析而设计的数据存储系统。 由于Druid 能够同时提供离线和实时数据的查询,因此Druid最常用作为GUI分析、业务监控、实时数仓的数据存储系统。 此外Druid拥有一个多进程,分布式架构,每个Druid组件类型都可以独立配置和...

No comments:

Post a Comment