《表2 简单匹配系数的相关参数》
式中,A表示两篇文章同时出现的关键词数量;D表示两篇文章都不包含的关键词数量;B和C表示一篇文章中包含而另一篇文章不包含的关键词数量;A+B+C+D表示全部关键词的数量,即词频矩阵的变量数。因此,简单匹配系数不仅计算公式简洁,而且可以有效利用这种词频矩阵的稀疏性来衡量相似性。具体参见表2。
图表编号 | XD0072251800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.24 |
作者 | 谭章禄、彭胜男、王兆刚 |
绘制单位 | 中国矿业大学(北京)管理学院、中国矿业大学(北京)管理学院、中国矿业大学(北京)管理学院 |
更多格式 | 高清、无水印(增值服务) |