《表2 基于语义的RDF数据划分方法总结》

《表2 基于语义的RDF数据划分方法总结》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《分布式环境下大规模资源描述框架数据划分方法综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

哈希划分方法以主语作为键值,将相同哈希值的三元组存入同一集群节点。在星型查询的场景下无需分布式节点间的通信在单个节点上即可求解,但是它不一定适用于非星型结构查询。相较于哈希划分方法对主语进行操作,垂直划分方法则是对谓词建立索引,其“两列表”的数据组织形式避免了属性表的空值和多值问题。但是谓词表的数量庞大,如何合理地利用有限的存储空间对这些谓词表进行管理,是一个值得思考的问题。模式划分方法相较于前两种方法,是对整个三元组模式进行挖掘,包括了主语、谓词和宾语,它能够从查询负载的角度设计RDF数据存储方案,并且监测查询模式的变化自适应地对存储在集群节点中的数据进行动态的更新,使数据存储变得更加灵活。但是,查询负载的变化相对来说是比较稳定的,如何权衡每次数据的重分布所花费的时空间代价与提升的查询效率是一个研究难点。表2为以上三种基于语义的RDF数据划分方法的优缺点、难点对比。