《表1 剔除异常数据方案整体评分》
在建立模型之前,首先需要对调查数据中的因变量单位面积产量进行有效性筛选。在建立模型之前,为了保证所建立模型的有效性,初步确定了有效剔除异常数据的3种方案:方案一,根据显著性差异去除;方案二,用单变量离散点检验去除;方案三,用差值分析的置信区间去除。而经过深入分析后发现,以显著性差异为标准对异常数据进行剔除虽然简单且容易操作,但其准确性相对比较差,难以满足研究的需要;单变量离散点检验方法能够确保数据的完整性,但操作起来相对比较复杂;以差值分析的置信区间去除异常数据虽然简单易行,但难以有效保证数据的完整性。小组成员围绕3种剔除方法的难易度、效果性、科学性、数据完整性和数据可行性等方面进行综合评分后,发现用单变量离散点检测去除异常数据的方法性价比相对比较高(见表1),因此,选择该方法对异常数据进行剔除。
图表编号 | XD0038706300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.15 |
作者 | 喻延、周艳宾、赵涛 |
绘制单位 | 黔南州烟草公司、河北中烟工业有限责任公司、河北中烟工业有限责任公司 |
更多格式 | 高清、无水印(增值服务) |