《表6 数据异常值检测结果(孤立森林算法)》
孤立森林算法本身并不会对样本数据中存在的异常值数量和规模进行限定,仅按照异常概率进行排序。在本文中,异常值的确定结合了专家经验。首先,对数据异常值进行检测的首要目的是监控取用水总量,因此数据异常值中最需要关注的是极大值和极小值。当出现极大值时,应考虑取水户是否存在超量取水,或计量统计过程是否产生偏差;当出现极小值时,应考虑取水户是否存在偷采行为。
图表编号 | XD00179341700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 赵臣啸、薛惠锋、王磊、万毅 |
绘制单位 | 中国航天系统科学与工程研究院、中国航天系统科学与工程研究院、中国航天系统科学与工程研究院、水利部水资源管理中心 |
更多格式 | 高清、无水印(增值服务) |