《表4 数据集统计信息Tab.4 The statistic information of datasets》

《表4 数据集统计信息Tab.4 The statistic information of datasets》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种基于悬挂顶点关联索引的最短路径查询算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验中使用11个真实数据集,分别是Agrocyc、Amaze、Anthra、Ecoo、Human、Kegg、Mtbrv、Vchocyc、Last、Uniprot22m和Uniprot100m。其中,Agrocyc、Anthra、Ecoo、Human、Mtbrv和Vchocyc是来自Eco Cyc(ecocyc.org)的数据集;Amaze和Kegg是代谢网络的数据集;Last是社交网络的数据集;Uniprot22m和Uniprot100m来自Uniprot数据库,它们都是完整Uniprot RDF图的子图。这些数据集都可以转换为无向图,数据集中顶点和边的信息如表4所示,其中|V|为图中的顶点数,|E|为图中的边数,从表4中可知,前8个数据集的规模较小,顶点数目在几千到几万之间,后3个数据集规模较大,顶点数目在百万到千万之间。为了比较在不同索引上最短路径查询策略的性能,对每个数据集随机选取1 000 000个顶点对进行实验。