Monday, June 14, 2021

OSCHINA 社区最新专区文章

OSCHINA 社区最新专区文章


Flink on Hive构建流批一体数仓

Posted: 11 Jun 2021 06:18 PM PDT

Flink使用HiveCatalog可以通过批或者流的方式来处理Hive中的表。这就意味着Flink既可以作为Hive的一个批处理引擎,也可以通过流处理的方式来读写Hive中的表,从而为实时数仓的应用和流批一体的落地实践奠定了坚实的基础。本文将以Flink1.12为例,介绍Flink集成Hive的另外一个非常重要的方面——Hive维表JOIN(Temporal T...

该如何理解数据仓库的建设?

Posted: 11 Jun 2021 06:41 PM PDT

什么是数据仓库 数据仓库,最早由比尔·恩门(Bill Inmon)于1990年提出,主要功能是将组织或企业里面的联机事务处理(OLTP)所累积的大量数据,透过数据仓库理论所特有的储存架构,进行系统的分析整理,以利于各种分析方法如联机分析处理(OLAP)、数据挖掘(Data Mining)的进行,并进而支持如决策支持系统(DSS)、主管信息系统...

层次数据结构的数据表设计

Posted: 10 Feb 2021 03:37 AM PST

# 层次数据结构的数据表设计 存储树形结构数据是一个常见的问题,同时也有多种解决方案。 这里介绍三种树形结构的表设计方案: - 邻接表模型 - 基于路径和层级的表设计 - 基于左右值编码的表设计(MPT) 这里以一个在线食品店作为例子,食品通过类别、颜色和品种组织食品。 示例如下: ![\[外链图片转存失败,源站可能有防...

Apache Jackrabbit 2.20.3 发布,可扩展、高性能分层存储库

Posted: 12 Jun 2021 03:59 PM PDT

Apache Jackrabbit 2.20.3 发布了。Jackrabbit Oak 是一种可扩展的高性能分层内容存储库,旨在用作现代世界级网站和其它要求苛刻的内容应用程序的基础。 主要更新内容 webdav:检查 PUT 上的 Content-Range 增加测试覆盖率,以恢复删除混合器的功能 将 Commons VFS 升级到 2.6 将 Jackrabbit 树干更新为 Oak 1.36.0 更新...

No comments:

Post a Comment