《表4 实验数据集统计信息》

《表4 实验数据集统计信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《有向无环图上k步可达查询优化算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验数据集由21个真实的数据集组成,这些数据集都广泛地出现在图论的可达性查询研究[14-16]中,它们的统计信息如表4所示。其中arxiv、citeseer、pubmed来自引文献[14];cit系列的数据集来自文献[6],其非叶子顶点的平均出度为10到30;uniprot100m、uniprot150m来自Uniprot数据库的注释联合图[15],皆是UniProt的完整资源描述框架(Resource Description Framework,RDF)的子集;soc-LJ(soc-LiveJournall)是来自社会网络的有向无环图;wikiTalk是来自维基百科的有向无环图;web-Google是来自Google网页的有向无环图;dbpedia为知识图;web-uk是文献[16]收集的网络有向无环图。由表4可知,除了前5个数据集的规模较小之外,其余数据集规模较大;|V|表示给定有向无环图的顶点数量,|E|为边的数量,|d|表示顶点的平均度。对于每个数据集,本文使用随机生成的100万个查询进行测试,算法的运行时间为处理100万个查询的总时间。