《表1 聚类分析结果:基于聚类分析浅析水利行业发展》
层次聚类是通过计算每一个类别的数据点与所有数据点之间的距离来确定它们之间的相似性。数据点之间的距离越小,相似度就越高。层次聚类法的优点是对样本的输入顺序不敏感。本文数据来源于中国统计年鉴,将选取以下7个指标来分析全国各省水利行业发展情况:水利、环境和公共设施管理业全社会固定资产投资;水利设施用地面积;水利、环境和公共设施管理业法人单位数;水利、环境和公共设施管理业城镇非私营单位就业人员数;水利、环境和公共设施管理业城镇非私营单位就业人员平均工资;水力发电量;供水综合生产能力,见表1。首先对数据进行标准化处理,然后对数据中的缺失值进行处理,用平均值来代替缺失值,使用欧式距离矩阵,来计算对比不同类别数据点之间的距离,并对距离值最小的数据点进行组合,生成聚类树。
图表编号 | XD0093668100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.01 |
作者 | 张婉 |
绘制单位 | 北方工业大学 |
更多格式 | 高清、无水印(增值服务) |