《表3 高频关键词标准化后的相异矩阵 (部分)》

《表3 高频关键词标准化后的相异矩阵 (部分)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Bicomb和SPSS的大数据环境下食品安全研究热点探析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在计算时关键词i和j共同出现的概率一般用Ochiia系数表示,Ni*j表示关键词i和j共现的频次,Ni、Nj则分别表示关键词i和j各自出现的频次。举个例子,“大数据”和“食品安全”共同出现的频次为32次,其中“大数据”出现的频次为75次,“食品安全”出现的频次为78次,则“大数据”和“食品安全”的Ochiia系数(保留三位)=。在相关矩阵中,数值越大表明关键词之间的相似度越好,但相关矩阵与共现矩阵一样,其中存在过多的0值,极易在统计分析时导致误差的产生,所以我们引入相异矩阵表示两个关键词之间相异程度,具体数据利用1与全部相关矩阵中的数据相减得到。例如“大数据”和“食品安全”的相异的系数为1-0.418=0.582。下表3为经过上述步骤后得到的相异矩阵,其中数值越小越好,表明关键词之间越相似。