《表1 数据湖与数据仓库的区别》

《表1 数据湖与数据仓库的区别》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《数据湖——现代化的数据存储方式》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

数据仓库(Data Warehouse)是一个面向主题的、集成的(Integrated)、相对稳定的、反映历史变化的数据集合,用于支持管理决策。[5]数据湖与数据仓库很类似,都是数据存储,两者之间主要区别如表1所示。数据仓库是优化后的数据库,在存储数据之前要先定义好数据结构。而数据湖是一个数据存储的平台,不需要定义数据,能够自由存储不同类型的数据。在加载数据时,数据仓库需要预先定义,即写时模式;数据湖则是在准备使用数据的时候定义数据,即读时模式。因此,数据湖提高了数据模型的定义灵活性,更能满足不同业务的需求。[6]