《表1 实验部分数据集:融合模拟退火的随机森林房价评估算法》
本文选取Kaggle竞赛中美国某地区成交房屋数据,数据包括81个特征变量,房屋属性值包含房屋类型MSSubClass、小区类型MSZoning、直线距离Lot Frontage、房屋面积Lot Area、月售额MoSold、年售额Yr Sold、销售类型Sale Type、销售状态SaleCondition、销售价格Sale Price等81个房屋属性,涵盖了房屋内部基本属性与周边环境状况,能够全方位地展示房屋基本信息。房屋部分数据集如表1所示。本文将Sale Price作为y变量,其他特征作为x变量进行算法训练。由表1可得,x变量中包含部分分类数据,本文采用one-hot编码对这部分数据进行特征化处理。缺失值采用均值进行填充,在进行数据平滑化处理后将数据划分为训练集与测试集,训练集占比为0.7。
图表编号 | XD00133925200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.01 |
作者 | 丁旸钧天、曹怀虎 |
绘制单位 | 中央财经大学信息学院、中央财经大学信息学院 |
更多格式 | 高清、无水印(增值服务) |