《表3 谱聚类分类结果:基于组合赋权法的高校网络影响力综合评价——以“双一流”高校为例》

《表3 谱聚类分类结果:基于组合赋权法的高校网络影响力综合评价——以“双一流”高校为例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于组合赋权法的高校网络影响力综合评价——以“双一流”高校为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在谱聚类算法在执行之前,需要指定输入到数据集中产生的分类个数,即类簇数量,选择合适的类簇数量是很重要的,它影响到了最终分类结果的准确性与合理性。一般通过各个簇内的样本点到所在簇质心的距离平方和(Sum of Squared Error,SSE)来进行判断,SSE越小说明各个类簇越收敛。当然SSE不是越小越好,因为一种极端情况时将所有的样本点视为簇,此时SSE为0,但是这样显然达不到分类的效果,因此需要在类簇数量与SSE之间找一个平衡,肘部法则提供了这样的方法。肘部法则[14]是一种在聚类分析中一致性解释与检验的方法,它将SSE解释为类簇数量的函数。首先,指定一个i值,即可能的最大类簇数,然后将类簇数从1开始递增,一直到i,计算出i个SSE。根据数据的潜在模式,当设定的类簇数不断逼近理想的类簇数时,SSE呈现快速下降态势,而当设定类簇数超过理想类簇数时,SSE也会继续下降,但是下降趋势会迅速趋于缓慢。通过画出K-SSE曲线,找出下降途中的拐点,即可较好的确定K值。图1展示了随着类簇数量增大时SSE的变化,可以看到类簇数量取5时比较合适,因此本文将39所高校的网络影响力数据划分为5类,最终得到的分类结果见表3。