《表1 多源信息主题相似性矩阵》

《表1 多源信息主题相似性矩阵》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《多源信息融合用于新兴技术发展趋势识别——以区块链为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本节选取每种信息源的前100名主题词作为各数据来源的属性值,计算相似性系数。由于在7种来源数据中,词频超过2的主题词均在100个词以内,因此,只选择前100个主题词做统计分析,基本代表了每种数据类型的主要主题范围,且避免了只出现一次的主题词导致的统计偏差。相似性计算采用jaccard系数,用来比较样本集中的相似性和分散性。Jaccard系数等于样本集交集与样本集合集的比值,即J=|A∩B|/|A∪B|。获得的相似性矩阵如表1所示。