《表4 余弦相似度和WMD距离皮尔逊相关系数》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于孪生网络的基金与受资助论文相关性判别模型构建研究》
笔者进一步对余弦夹角和词移距离两种相反的角度计算的结果计算皮尔逊相关系数。从表4的结果可以看出余弦相似度和词移距离之间的相关性都小于-0.8,达到显著负相关,证明了实验结果的有效性。因为词移距离的值域为[0,+∞),不便于分段统计,下文的统计分析围绕余弦相似度展开。表5为基金项目-论文标题相似度、基金项目-论文摘要相似度和论文标题-论文摘要相似度两两之间的相关性。因为来自同一篇论文的标题和摘要一定是属于同一研究的,所以可以提出合理的假设:论文标题与论文摘要的相似度一定较高。表5呈现的结果显示基金项目-论文标题相似度、基金项目-论文摘要相似度和论文标题-论文摘要相似度之间的相关性都较低,分别仅为0.42和0.27,达不到显著相关。说明当论文标题与摘要相似度高时,基金标题与论文标题或论文摘要的相似度都不高,即基金项目从其标题体现的语义与其资助的论文语义相似度从宏观上看相关性较低。
图表编号 | XD00168289400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.24 |
作者 | 叶文豪、王东波、沈思、苏新宁 |
绘制单位 | 南京大学信息管理学院、江苏省数据工程与知识服务重点实验室、南京农业大学信息科学技术学院、南京理工大学经济管理学院、南京大学信息管理学院、江苏省数据工程与知识服务重点实验室 |
更多格式 | 高清、无水印(增值服务) |