《表2 数据集wdbc在算法上实验数据》
利用spark分布式框架进行聚类运算获取K范围内每个K对应的误差平方和,有效的提高了数据量大及数据多次迭代的效率,利用本文提出的方法自动确认手肘法肘部K值。实验结果如下:K范围取1~10,表22为数据集wdbc和iris的实验数据,其中wdbc为未抽样数据,iris为抽样数据,表中只给出K值为1~8的实验数据值,图6展示了实验的效果图,由图可直观的确认最长的红线所在的X轴坐标为聚类数K值。
图表编号 | XD0073052500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.01 |
作者 | 吴广建、章剑林、袁丁 |
绘制单位 | 杭州师范大学阿里巴巴商学院、杭州师范大学阿里巴巴商学院、杭州师范大学阿里巴巴商学院 |
更多格式 | 高清、无水印(增值服务) |