《表4 数据质量评估表:2007–2015年太湖水体理化监测数据集》

《表4 数据质量评估表:2007–2015年太湖水体理化监测数据集》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《2007–2015年太湖水体理化监测数据集》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本数据集内共有数据864条,每条数据包含16个指标共计13 810个数值,其中缺失数值14个(表4)。为检验数据质量,我们使用箱线图法计算数据集中各指标的四分位间隔范围(IQR=Q3-Q1,其中Q3和Q1分别为上、下四分位数)来检验数据集中各指标的离群值(Outlier)和异常值(Extreme)[8]。我们将高于上四分位数或低于下四分位数1.5倍IQR的数据标记为离群值;高于上四分位数或低于下四分位数3倍IQR的数据标记为异常值,除去离群值和异常值之外的数据称为有效数据。本数据集16个指标中有10个指标的有效数据占比达到95%以上,仅有1个指标的有效数据占比在90%以下(表4)。本数据集中没有剔除筛选出来的离群值和异常值,只是对可能存在问题的数据进行标记,供使用该数据集的研究人员参考。