《表2 缺失值的处理规则:基于机器学习的房地产批量评估模型》
数据集有14个特征存在缺失值,需要根据该特征对样本重要性,对缺失值进行处理。根据张松兰等(2016)[15]归纳的不同情况下缺失数据的处理方法,本文采取表2所示的规则:缺失规模比较小时,则删除该特征中存在缺失的样本;缺失规模非常大时,删除该特征,以免人为的噪音;缺失规模中等并且该特征比较重要时,用统计方法中的常值填补。
图表编号 | XD00172807400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.10 |
作者 | 陈诗沁、王洪伟 |
绘制单位 | 同济大学经济与管理学院、同济大学经济与管理学院 |
更多格式 | 高清、无水印(增值服务) |