《表2 SSE、ET-SSE在dataR2、Iris、Wine及Immunotherapy数据集上的计算数据》
为了说明改进的k值选择算法ET-SSE的实际运行效果,本文采用dataR2、Iris、Wine和Immunotherapy数据集进行对比实验,k的取值范围设定为[1,8]。从表1、表2和图6中通过比较程序运行所产生的计算结果,能够很容易发现,传统的“手肘法”在四个UCI数据集中预测的最佳k值均为一个范围域(离散型),对于大部分预测结果,实际的最佳k值包含在此范围内,一小部分k值预测出现严重偏差,k值的确定过程存在很大的误差;而ET-SSE算法预测的最佳k值均为一个固定的数,与实际的数据集的聚类数完全相同,精度较高。本文算法确定的k值更加接近实际的聚类数,预测效果更佳,能有效解决传统“手肘法”在应用过程中“肘点”不明显的问题。
图表编号 | XD0035460600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.04.15 |
作者 | 王建仁、马鑫、段刚龙 |
绘制单位 | 西安理工大学经济与管理学院、西安理工大学经济与管理学院、西安理工大学经济与管理学院 |
更多格式 | 高清、无水印(增值服务) |