《表4 实验数据集统计信息》
实验数据集由21个真实的数据集组成,这些数据集都广泛地出现在图论的可达性查询研究[14-16]中,它们的统计信息如表4所示。其中arxiv、citeseer、pubmed来自引文献[14];cit系列的数据集来自文献[6],其非叶子顶点的平均出度为10到30;uniprot100m、uniprot150m来自Uniprot数据库的注释联合图[15],皆是UniProt的完整资源描述框架(Resource Description Framework,RDF)的子集;soc-LJ(soc-LiveJournall)是来自社会网络的有向无环图;wikiTalk是来自维基百科的有向无环图;web-Google是来自Google网页的有向无环图;dbpedia为知识图;web-uk是文献[16]收集的网络有向无环图。由表4可知,除了前5个数据集的规模较小之外,其余数据集规模较大;|V|表示给定有向无环图的顶点数量,|E|为边的数量,|d|表示顶点的平均度。对于每个数据集,本文使用随机生成的100万个查询进行测试,算法的运行时间为处理100万个查询的总时间。
图表编号 | XD00133780900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.10 |
作者 | 杜明、杨安平、周军锋、陈子阳、杨云 |
绘制单位 | 东华大学计算机科学与技术学院、东华大学计算机科学与技术学院、东华大学计算机科学与技术学院、上海立信会计金融学院信息管理学院、东华大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |