数据湖构建某汽车集团数据中台解决方案19.9.pptx
2022-07-04 18:04:20 21.77MB 数据湖 数据中台
基于数据湖的数据中台解决方案19.9.pptx
2022-07-03 21:06:17 5.51MB 数据湖 数据中台
基于Flink+Iceberg构建企业级实时数据湖4.9.pdf
2022-07-03 13:04:41 2.67MB flink iceberg 数据湖
数据仓库数据湖数据中台建设详解-4.9.pdf
2022-07-03 13:04:40 9.87MB 数据仓库 数据中台 数据湖
基于数据湖的数据中台解决方案19.9.pptx
2022-06-26 19:06:45 5.51MB 数据湖 数据中台
数据湖构建某汽车集团数据中台解决方案19.9.pptx
2022-06-26 19:06:19 21.77MB 数据湖 数据中台
大多数大数据企业在构建数仓时采用Lambda架构,一条离线数仓链路,一条实时数仓链路。一些实时业务多的公司构建数仓时采用Kappa架构,但是也避免不了离线处理一些数据,所以一些公司也采用Kappa架构+Lambda架构方式构建数仓。以上不同的架构都有各自的优点及缺点,这里不再赘述。批数据处理与流式数据处理的不同效率决定了针对两类数据采用不同的架构进行分析处理,未来数据仓库的发展也终将走向批数据和流数据使用同一套架构处理,同时也要求批数据及流数据存储上也需要统一,这就所说的批流一体,那么使用什么技术可以既能满足批数据海量存储分析又能满足实时数据存储的效率高、支持数据更新删除?数据湖技术应运而生,湖仓一体架构也被提出。Iceberg就是典型的数据湖技术,支持批数据和流式数据的存储,同时还支持高效的OLAP分析查询。
2022-06-21 21:03:20 901.19MB 数据湖 湖仓一体化 iceberg
实时数仓实践
2022-06-20 09:07:55 2.77MB 实时数仓
华为数据湖治理中心数据治理方法论.pdf
2022-06-06 11:00:14 1.85MB 数据治理
华为数据湖治理中心用户指南.pdf
2022-06-06 11:00:12 21.1MB 数据治理