《表1 中小文件的存储结构》

《表1 中小文件的存储结构》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种通用的工业大数据应用中海量对象存储方法实现》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

因此,对于中小型文件[9]的存储结构采用如表1所示的设计方案。采用文件的全路径作为行键提供精确的文件读写功能,同时支持前缀匹配的分目录检索功能。其中,列族部分用于对象的桶分隔,利用列式存储的特性减少文件访问时集群的IO,文件对象的内容数据与元数据分别采用不同列存储设计方式,这样不仅便于在对象的遍历和查询等操作时,避免操作内容数据的存储区域,同时还可以降低访问的网络负载和磁盘IO[10]。元数据采用json格式组织信息,包括唯一标志id、类型type、长度len、创建时间ct、内容为MD5的tag信息等,弥补Hbase无法提供文件校验功能的不足,因此给用户提供了防篡改功能,即用户使用客户端通过查询元数据信息来确认对象内容。