《表1 多源信息主题相似性矩阵》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《多源信息融合用于新兴技术发展趋势识别——以区块链为例》
本节选取每种信息源的前100名主题词作为各数据来源的属性值,计算相似性系数。由于在7种来源数据中,词频超过2的主题词均在100个词以内,因此,只选择前100个主题词做统计分析,基本代表了每种数据类型的主要主题范围,且避免了只出现一次的主题词导致的统计偏差。相似性计算采用jaccard系数,用来比较样本集中的相似性和分散性。Jaccard系数等于样本集交集与样本集合集的比值,即J=|A∩B|/|A∪B|。获得的相似性矩阵如表1所示。
图表编号 | XD00110126700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.24 |
作者 | 张维冲、王芳、赵洪 |
绘制单位 | 南开大学商学院信息资源管理系、中电科大数据研究院有限公司、南开大学商学院信息资源管理系、南开大学网络社会治理研究中心、南开大学商学院信息资源管理系、中电科大数据研究院有限公司 |
更多格式 | 高清、无水印(增值服务) |