《表1 中小文件的存储结构》
因此,对于中小型文件[9]的存储结构采用如表1所示的设计方案。采用文件的全路径作为行键提供精确的文件读写功能,同时支持前缀匹配的分目录检索功能。其中,列族部分用于对象的桶分隔,利用列式存储的特性减少文件访问时集群的IO,文件对象的内容数据与元数据分别采用不同列存储设计方式,这样不仅便于在对象的遍历和查询等操作时,避免操作内容数据的存储区域,同时还可以降低访问的网络负载和磁盘IO[10]。元数据采用json格式组织信息,包括唯一标志id、类型type、长度len、创建时间ct、内容为MD5的tag信息等,弥补Hbase无法提供文件校验功能的不足,因此给用户提供了防篡改功能,即用户使用客户端通过查询元数据信息来确认对象内容。
图表编号 | XD0045477400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.01 |
作者 | 黄明、赵若尘、张云龙 |
绘制单位 | 上海宝信软件股份有限公司研发部、上海宝信软件股份有限公司研发部、上海宝信软件股份有限公司研发部 |
更多格式 | 高清、无水印(增值服务) |