《表3 改进的K均值聚类结果》

《表3 改进的K均值聚类结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于数据挖掘的住宅工程造价预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

如图1所示,横坐标代表聚类数,纵坐标D=组内平均距离/组间平均距离,由D的定义可知,D越小代表聚类效果越好,但是D过小,所划分的类别数过多,则其实际应用价值就会降低,故K的取值需适宜。根据肘部法则,图线突变点的位置为最优K值,由图1可知最优K值为10。K值确定后,本研究选用SPSS工具进行K均值聚类,聚类结果如表3,第2~4,7~10类样本呈零星分布状态,视为离群点,需筛除,保留样本最为集中的第1,5,6类共160条项目为最终样本。部分样本数据如表4所示。