《表7 实验结果对比:基于二模网络链路预测的合作者识别方法研究》
为了验证本文方法和分析结果的准确性,本文将二模网络链路预测合作者推荐方法与基于研究内容的TF-IDF方法进行对比。在TF-IDF方法中,构建了作者-关键词网络,根据本文预处理得到的1204个关键词在作者论文中出现的频率TF以及在所有论文中的逆文档率IDF,两者相乘构成了表示作者研究内容的向量;并利用余弦相似度得到作者之间研究内容的相似度,根据相似度排名来推荐合作者。本文将2008年1月1日—2017年12月31日的数据作为训练集,同时,下载2018年1月1日—2019年12月31日的论文数据作为测试集,保持训练集和测试集比例约为5∶1。其中2008—2017年共产生合作460次,2018—2019年共产生新合作68次。将基于2008—2017年的数据预测的合作结果与实际合作情况进行比较,对两种方法分别选取每位学者合作可能性前N名的潜在合作者来验证方法的有效性,对比结果如表7所示。
图表编号 | XD00224570200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.24 |
作者 | 黄璐、倪兴兴、程坷飞、贾翔 |
绘制单位 | 北京理工大学管理与经济学院、北京理工大学管理与经济学院、中国北方工业有限公司、中国东方航空江苏有限公司 |
更多格式 | 高清、无水印(增值服务) |