《表1 不同的类簇个数对聚类效果的影响》
K-均值聚类算法中,不同的K值对聚类效果有着重要的影响,本实验采用平均轮廓系数来确定类簇的个数,数据集中共有1 682部电影,通过分析数据集中电影的数据规模、类别特征以及已有的K均值算法对于MovieLens数据集的聚类效果,将K值设定在[2,50]。由于K-均值聚类具有一定的随机性,并不是每次都收敛到全局最小,为了避免得到局部最优解,针对区间内每一个K值,重复执行30次,计算每一次的,并取其平均值度量K值的聚类效果。由于篇幅有限,表1列出了部分较大时聚类质量情况。
图表编号 | XD00107228500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 阙正昊、邓明通、刘学军、李斌 |
绘制单位 | 南京工业大学计算机科学与技术学院、南京工业大学计算机科学与技术学院、南京工业大学计算机科学与技术学院、南京工业大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |