《表7 基于因子分析的系统聚类》
聚类分析是一种多元统计方法,它以各种距离来度量个体间的“亲疏程度”。从各种距离的定义来看,被选择的每个变量都在距离中做出了一定“贡献”。系统聚类,也称为层次聚类,它是指聚类过程按一定层次进行的[6]。系统聚类分为q型聚类和r型聚类两种类型;聚类方式分为凝聚方式聚类和分解方式聚类。本文运用的方法为凝聚方式聚类:首先,每个观测个体自成一类;然后按照某种方法度量所有个体间的“亲疏程度”,并将其中最“亲密”的个体聚成一小类,形成n-1个类;再次度量剩余个体和小类之间的“亲疏程度”,把当前最亲密的个体或小类聚成一类;不断重复上述过程,将所有个体和小类聚集成越来越大的类,最终所有个体聚成一个最大的类。在此过程中,所有类别内的“亲密”程度一直在逐渐降低。对于n个观测个体,可以通过n-1步可凝聚成一大类。“亲疏程度”度量方式分为最近邻距离(Nearest neighbor distance),最远邻距离(Farthest neighbor distance),组间平均链锁距离(Average chain distance between groups),组内平均链锁距离(Average intergroup chain distance),重心距离和离差平方和法(也称ward法)[7]。本文采用的就是ward法,以因子分析得到的4个因子作为变量在SPSS中利用ward法聚类得到南疆四地州聚类结果,见图1(阴影区域为新疆维吾尔自治区直辖县市),整理后得到基于因子分析的系统聚类,见表7。
图表编号 | XD0070304700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.30 |
作者 | 魏梦瑶、张庆红 |
绘制单位 | 新疆财经大学统计与数据科学学院、新疆财经大学统计与数据科学学院 |
更多格式 | 高清、无水印(增值服务) |