《表1 概念间的有向关系:基于大数据的主动科研管理模式与优化决策机制》
本节内容阐释学术网络领域的开放知识网络的自增长过程。笔者从互联网上的开放学术页面中爬取数据,寻找开放知识网络的5类节点(作者、文章、组织、会议、关键词)。笔者从DBLP(database systems and logic programming)书目网、微软学术搜索、Google学术搜索等多种资源中开放式地获取数据。笔者从在1928年到2012年信息检索、数据挖掘、人工智能、机器学习和计算机科学这5个领域的顶级会议上发表超过3篇论文的作者中选取一个子集,作为种子使用者;接下来,寻找这些作者的合著者、隶属的组织以及在他们文章中提到的关键词。这些作者、文章、组织、会议以及关键词的总数分别是2 030、857、920、260和7 004。将这些数字相加得到学术开放知识网络的11 071个顶点。针对这个网络的边,笔者在表1中列举了这些概念间的所有有向关系的类型,其中前两列是概念对和它们间的双向关系,第三列表示关系存在的时间,其中,t表示开始时间,t’表示结束时间,表示无穷长。数据集中有如下关系的事例对的总数是29 332。
图表编号 | XD0086068700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.15 |
作者 | 罗瑞丽、王元卓 |
绘制单位 | 中国科学院计算技术研究所、中国科学院计算技术研究所 |
更多格式 | 高清、无水印(增值服务) |