《表2 定性指标编码:基于数据挖掘的住宅工程造价预测》
在通过机器学习方法进行住宅工程各造价项的预测研究时,具备一个完备的数据集是重要前提,实际上,原始数据的搜集和预处理工作往往占整个数据分析工作的70%以上。本研究的数据来源于广联达指标网,陕西省西安市2014—2017年签约的住宅工程。拟预测的造价项包括含其他项目费的单方造价(指标名称为原单方造价),不含其他项目费的单方造价(指标名称为单方造价),以及单位建筑面积的分部分项工程费、措施项目费、其他项目费、规费、税金等,如表1输出指标所示。结合文献调研及专家访谈,本研究确定了19个特征指标作为造价预测模型的输入指标,如表1所示。输入指标又分为定性指标和定量指标。定量指标按原数值输入,定性指标按表2的编码方式处理。机器学习中定性指标的编码方式有多种,各有其优劣。本文采用特征哈希的思想,对定性指标进行编码,每种定性指标的编码为相邻的自然数,此外,为了增强哈希特征工程的可解释性,对“是否有人防”“抗震烈度”“装修类别”“外立面装饰”和“室内装饰”五个定性指标,按相应各类别造价由低到高的顺序依次进行由小到大的编码,如表2所示。
图表编号 | XD00211840800 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.01 |
作者 | 王德美、陈慧、肖之鸿、夏松林、范淑倩、崔常辉、张清华 |
绘制单位 | 烟台大学土木工程学院、烟台大学土木工程学院、广东海龙建筑科技有限公司、烟台大学土木工程学院、烟台大学土木工程学院、烟台大学土木工程学院、烟台天海房地产开发有限公司 |
更多格式 | 高清、无水印(增值服务) |