《表4 基于cosine相似系数的距离矩阵》
基于上述文本特征向量矩阵,我们通过距离计算公式可以度量样本间(记录间)或变量间(关键词间)的相似程度。余弦相似度(cosine)计算利用向量方向差异性进行距离判别。以cosine相似度作为计算方式,计算特征词变量间相似系数矩阵(表3),并最终转化成距离矩阵(表4)。相似系数转化为距离系数的转化过程为1-Sim(x,y)。表3所示的相似系数矩阵中最大值为1,最小值为0,值越大,代表技术关键词之间的相似度越高。表4所示的距离矩阵与相似系数矩阵相反,值越大,代表技术关键词之间的距离越大。如“货币发行”与“物联网”“金融科技”的距离值为1,说明关键词所代表的研究方向差异化较大。
图表编号 | XD0079743900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.03.28 |
作者 | 苑朋彬、佟贺丰、杨帅、赵蕴华 |
绘制单位 | 中国科学技术信息研究所、中国科学技术信息研究所、中国科学技术信息研究所、中国科学技术信息研究所 |
更多格式 | 高清、无水印(增值服务) |