《表2 数据集B各指标相关系数》
利用Pearson相关系数ξ评估标准数据矩阵各个指标变量之间的线性相关程度。取相关程度阈值为0.8,ξ>0.8表示2个变量之间线性相关程度较高。数据集A各指标相关系数见表1,数据集B各指标相关系数见表2。表1中,相关系数的绝对值大于0.8的有X1和X8,X2和X8,X4和X6,X4和X11,X6和X11,X7和X11,11对指标中有6对指标相关性过大,信息重叠使得信息丰富性降低。表2中,相关系数的绝对值大于0.8的有Y3和Y4,Y1和Y5,Y1和Y7,Y5和Y7,7对指标中有4对指标相关性过大,信息重叠使得信息丰富性降低。因此,对数据进行PCA分析,突出各个指标的特征,避免对模型精度的影响。进行PCA分析时,计算得到各个主成分的特征值、贡献率、累计贡献率,见表3。一般情况下,取累计贡献率大于85%的成分作为新的主成分。由表3可知,数据集A经过PCA处理得到4个新主成分PA′1—PA′4(式(6));数据集B经过PCA处理得到4个新主成分PB′1—PB′4(式(7))。
图表编号 | XD00191776400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.01 |
作者 | 秋兴国、王瑞知、张卫国、张昭昭、张婧 |
绘制单位 | 西安科技大学计算机技术与科学学院、西安科技大学计算机技术与科学学院、西安科技大学计算机技术与科学学院、西安科技大学计算机技术与科学学院、西安科技大学计算机技术与科学学院 |
更多格式 | 高清、无水印(增值服务) |