《表2 简单匹配系数的相关参数》

《表2 简单匹配系数的相关参数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于聚类分析的国内文本挖掘热点与趋势研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

式中,A表示两篇文章同时出现的关键词数量;D表示两篇文章都不包含的关键词数量;B和C表示一篇文章中包含而另一篇文章不包含的关键词数量;A+B+C+D表示全部关键词的数量,即词频矩阵的变量数。因此,简单匹配系数不仅计算公式简洁,而且可以有效利用这种词频矩阵的稀疏性来衡量相似性。具体参见表2。