《表3 高血压住院总费用K-means聚类结果》
利用肘部法则确定最优K值的核心指标是误差平方和(sum of the squared errors,SSE)。随着聚类数K的增大,样本划分会更加精细,每个簇的聚合程度会提高,SSE逐渐变小。当K小于真实聚类数时,由于K的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度会很大,而当K到达真实聚类数时,再增加K所得到的聚合程度回报会迅速变小,所以SSE的下降幅度会骤减,而这个肘部对应的K值就是数据的真实聚类数。图2可见,肘部点为K=4,聚类结果见表3。
图表编号 | XD0059019900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.15 |
作者 | 李相蓉、韩颖 |
绘制单位 | 山西医科大学、山西医科大学 |
更多格式 | 高清、无水印(增值服务) |