《表1 数据仓库、集中式数据湖与分布式数据湖对比》

《表1 数据仓库、集中式数据湖与分布式数据湖对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《虚拟化模型驱动的分布式数据湖构建方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

所提数据仓库系统的代表包括早期的国网系统、银行系统;随着大数据分析条件的逐步具备和决策支持业务对数据总量的需求越来越大,这些数据仓库系统逐步向集中式数据湖系统发展,但随着数据量的持续堆积,集中式数据湖的治理问题越发突出。对比发现,所提虚拟化模型驱动的分布式数据湖构建方法相比传统的数据仓库技术、集中式数据湖技术,在同时满足工商联分析业务对大数据的需求和实时处理业务对鲜活数据的需要方面具有优势,尤其在减少数据搬运成本,提升经济性方面存在较明显的优势,结果参见表1。