《表2 标签相似度数值矩阵》
注:表中横纵交叉的数值代表两标签之间的相似度值,规定一个词与它本身的相似度为1。
这样就得到了由多个词汇组合而形成的标签相似度,然后将大于某阈值的标签进行关联,举例如表2所示。如若计算“科技”和“科技成果”两词之间的相似度,则把“科技成果”拆分为“科技”和“成果”,分别求它们和“科技”之间的相似度,再将相似度之和除以2,即可得到单纯标签词“科技”和复合标签词“科技成果”之间的相似度。多个复合标签词亦同理。在表2中,假设阈值为0.25,这样就建立了“创新战略”与“国际化水平”、“科技成果”与“互联网”等标签之间的标签关联。
图表编号 | XD00204849900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.24 |
作者 | 赵辉、化柏林、何鸿魏 |
绘制单位 | 北京大学信息管理系、北京大学信息管理系、北京大学信息管理系 |
更多格式 | 高清、无水印(增值服务) |