《表2 标签相似度数值矩阵》

《表2 标签相似度数值矩阵》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《科技情报用户画像标签生成与推荐》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:表中横纵交叉的数值代表两标签之间的相似度值,规定一个词与它本身的相似度为1。

这样就得到了由多个词汇组合而形成的标签相似度,然后将大于某阈值的标签进行关联,举例如表2所示。如若计算“科技”和“科技成果”两词之间的相似度,则把“科技成果”拆分为“科技”和“成果”,分别求它们和“科技”之间的相似度,再将相似度之和除以2,即可得到单纯标签词“科技”和复合标签词“科技成果”之间的相似度。多个复合标签词亦同理。在表2中,假设阈值为0.25,这样就建立了“创新战略”与“国际化水平”、“科技成果”与“互联网”等标签之间的标签关联。