《表1 数据仓库、集中式数据湖与分布式数据湖对比》
所提数据仓库系统的代表包括早期的国网系统、银行系统;随着大数据分析条件的逐步具备和决策支持业务对数据总量的需求越来越大,这些数据仓库系统逐步向集中式数据湖系统发展,但随着数据量的持续堆积,集中式数据湖的治理问题越发突出。对比发现,所提虚拟化模型驱动的分布式数据湖构建方法相比传统的数据仓库技术、集中式数据湖技术,在同时满足工商联分析业务对大数据的需求和实时处理业务对鲜活数据的需要方面具有优势,尤其在减少数据搬运成本,提升经济性方面存在较明显的优势,结果参见表1。
图表编号 | XD0069563300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 谭景信、刘玉龙、李慧娟 |
绘制单位 | 华北计算技术研究所、华北计算技术研究所、华北计算技术研究所 |
更多格式 | 高清、无水印(增值服务) |