《表4 数据集统计信息Tab.4 The statistic information of datasets》
实验中使用11个真实数据集,分别是Agrocyc、Amaze、Anthra、Ecoo、Human、Kegg、Mtbrv、Vchocyc、Last、Uniprot22m和Uniprot100m。其中,Agrocyc、Anthra、Ecoo、Human、Mtbrv和Vchocyc是来自Eco Cyc(ecocyc.org)的数据集;Amaze和Kegg是代谢网络的数据集;Last是社交网络的数据集;Uniprot22m和Uniprot100m来自Uniprot数据库,它们都是完整Uniprot RDF图的子图。这些数据集都可以转换为无向图,数据集中顶点和边的信息如表4所示,其中|V|为图中的顶点数,|E|为图中的边数,从表4中可知,前8个数据集的规模较小,顶点数目在几千到几万之间,后3个数据集规模较大,顶点数目在百万到千万之间。为了比较在不同索引上最短路径查询策略的性能,对每个数据集随机选取1 000 000个顶点对进行实验。
图表编号 | XD0014165800 严禁用于非法目的 |
---|---|
绘制时间 | 2018.05.31 |
作者 | 陈伟、楼志斌、杨清章 |
绘制单位 | 河北环境工程学院信息工程系、上海科学院、燕山大学信息科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |
查看“表4 数据集统计信息Tab.4 The statistic information of datasets”的人还看了
- 表4 样本企业信息披露考评结果统计表Tab.4 Statistical table of classification of industry information disclosure evaluation results