《表4 数据质量评估表:2007–2015年太湖水体理化监测数据集》
本数据集内共有数据864条,每条数据包含16个指标共计13 810个数值,其中缺失数值14个(表4)。为检验数据质量,我们使用箱线图法计算数据集中各指标的四分位间隔范围(IQR=Q3-Q1,其中Q3和Q1分别为上、下四分位数)来检验数据集中各指标的离群值(Outlier)和异常值(Extreme)[8]。我们将高于上四分位数或低于下四分位数1.5倍IQR的数据标记为离群值;高于上四分位数或低于下四分位数3倍IQR的数据标记为异常值,除去离群值和异常值之外的数据称为有效数据。本数据集16个指标中有10个指标的有效数据占比达到95%以上,仅有1个指标的有效数据占比在90%以下(表4)。本数据集中没有剔除筛选出来的离群值和异常值,只是对可能存在问题的数据进行标记,供使用该数据集的研究人员参考。
图表编号 | XD00165346600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.01 |
作者 | 闵屾、钱荣树、朱广伟、黄建明、秦伯强、杨宏伟、李宽意、张运林、沈睿杰 |
绘制单位 | 中国科学院南京地理与湖泊研究所、中国科学院太湖湖泊生态系统研究站、中国科学院太湖湖泊生态系统研究站、中国科学院南京地理与湖泊研究所、中国科学院太湖湖泊生态系统研究站、中国科学院太湖湖泊生态系统研究站、中国科学院南京地理与湖泊研究所、中国科学院太湖湖泊生态系统研究站、中国科学院南京地理与湖泊研究所、中国科学院太湖湖泊生态系统研究站、中国科学院南京地理与湖泊研究所、中国科学院太湖湖泊生态系统研究站、中国科学院南京地理与湖泊研究所、中国科学院太湖湖泊生态系统研究站、中国科学院南京地理与湖泊研究所、中国科学院太湖 |
更多格式 | 高清、无水印(增值服务) |