《表1 剔除异常数据方案整体评分》

《表1 剔除异常数据方案整体评分》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种黔南州烤烟产量到户预测模型的构建河南农》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在建立模型之前,首先需要对调查数据中的因变量单位面积产量进行有效性筛选。在建立模型之前,为了保证所建立模型的有效性,初步确定了有效剔除异常数据的3种方案:方案一,根据显著性差异去除;方案二,用单变量离散点检验去除;方案三,用差值分析的置信区间去除。而经过深入分析后发现,以显著性差异为标准对异常数据进行剔除虽然简单且容易操作,但其准确性相对比较差,难以满足研究的需要;单变量离散点检验方法能够确保数据的完整性,但操作起来相对比较复杂;以差值分析的置信区间去除异常数据虽然简单易行,但难以有效保证数据的完整性。小组成员围绕3种剔除方法的难易度、效果性、科学性、数据完整性和数据可行性等方面进行综合评分后,发现用单变量离散点检测去除异常数据的方法性价比相对比较高(见表1),因此,选择该方法对异常数据进行剔除。