《表4 填补后各变量参数及其标准误差》
在R语言分别对三种填补方法的数据集作多元线性回归结果(见表4)。均值填补法填补完成的数据集经过R语言分析之后所得到常数项、变量系数的取值及标准误差与完整数据集的常数项、变量系数的取值及标准误差相比较是偏小的,但偏差不是很大。KNN填补效果与简单的均值填补效果基本一样。对于本文收集到的数据集类型和缺失占比,使用多重填补法填补的次数不同,得出的效果还是有一定差别的。通过表格数据对比,显然多重填补效果最接近完整数据集,可以发现多重填补法填补3次的效果最为理想,而使用多重填补法填5次以上的常数项、变量系数的取值及标准误差基本保持不变。
图表编号 | XD00204221600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.25 |
作者 | 樊毅龙、马先林、连建文 |
绘制单位 | 西安石油大学石油工程学院、西安石油大学石油工程学院、陕西省油气田特种增产技术重点实验室、成都理工大学 |
更多格式 | 高清、无水印(增值服务) |