《表2 词篇矩阵的聚类指标》

《表2 词篇矩阵的聚类指标》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于自然指数刊文数据对全球医学研究领域热点的探析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

选择类内相似度ISim相对较大,且类间相似度ESim相对较小的聚类结果,最终确定聚类数目为10。gCLUTO结果给出每个聚类的相似性指标ISim(类内对象间平均相似度)与ESim(代表类间平均相似度)。ISim越大,ESim越小说明聚类结果将相似的类聚到一起,不同类间相似度较小,因此效果较好。如表2所示,第一列表示聚类分为10个类别,Size代表每个类别所含高频词的数量。本次聚类中ISim的值远大于ESim的值,说明聚类结果较好。此软件还给出了聚类特征:Descriptive Features(代表性特征)和Discriminating Features(区分性特征),来衡量聚类效果及作为类别标注的参考。表3中列出了类别中Descriptive与Discriminating指标值最大的前几篇文献,Descriptive的值表示该文献可以解释类内相似性的百分比,Discriminating的值解释该类与其他类间的相异性[18]。我们将代表性文章视为能够代表这一类特征的文献编号,区分性文章视为能区分于其他类的文献编号(编号可以在PubMed查找相对应的文献)。