《表1 多特征属性数据组:基于行键的HBase大数据文件存储转换与快速检索研究》

《表1 多特征属性数据组:基于行键的HBase大数据文件存储转换与快速检索研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于行键的HBase大数据文件存储转换与快速检索研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

HBase按照Row Key字典序来存放数据,为了尽可能提高多关键字查询的效率,本文提出按照特征值检索方式生成Row Key,将常用检索特征生成Row Key时放在靠前位置。例如,表1所示多特征属性数据集代表某三维空间的一系列指标数据,若需要将特征3作为检索条件,即示例中检索出z坐标固定的某一横切面的数据,则HBase中最终生成的Row Key以及数据存储形式如表2所示;若需要将特征1作为检索条件,即示例中检索出x坐标固定的某一纵切面的数据,则HBase中最终生成的Row Key以及数据存储形式如表3所示。通过这种方式能够将同一特征值相近的数据尽可能存储在一起,查询时能够方便通过Row Key前缀匹配进行过滤,对过滤结果进行再次筛选以得到最终结果集,避免频繁采取全表扫描方式检索数据,从而提高查询的效率。为满足快速检索的需要,通常对某个类型的数据文件创建多个导入规则,设置Row Key表达式时,按检索需求排列所提取特征值的顺序,并将不同特征值排列获得的Row Key与描述数据一起在多个表中冗余存储。