《表2 定性指标编码:基于数据挖掘的住宅工程造价预测》

《表2 定性指标编码:基于数据挖掘的住宅工程造价预测》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于数据挖掘的住宅工程造价预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在通过机器学习方法进行住宅工程各造价项的预测研究时,具备一个完备的数据集是重要前提,实际上,原始数据的搜集和预处理工作往往占整个数据分析工作的70%以上。本研究的数据来源于广联达指标网,陕西省西安市2014—2017年签约的住宅工程。拟预测的造价项包括含其他项目费的单方造价(指标名称为原单方造价),不含其他项目费的单方造价(指标名称为单方造价),以及单位建筑面积的分部分项工程费、措施项目费、其他项目费、规费、税金等,如表1输出指标所示。结合文献调研及专家访谈,本研究确定了19个特征指标作为造价预测模型的输入指标,如表1所示。输入指标又分为定性指标和定量指标。定量指标按原数值输入,定性指标按表2的编码方式处理。机器学习中定性指标的编码方式有多种,各有其优劣。本文采用特征哈希的思想,对定性指标进行编码,每种定性指标的编码为相邻的自然数,此外,为了增强哈希特征工程的可解释性,对“是否有人防”“抗震烈度”“装修类别”“外立面装饰”和“室内装饰”五个定性指标,按相应各类别造价由低到高的顺序依次进行由小到大的编码,如表2所示。