《表4:因子得分系数矩阵:房地产上市公司盈利能力测算与比较》
由于随机森林模型对于异常值比较敏感,数据可能会出现特别大或特别小的情况,采用分位数进行分级排除异常值影响。综合计量指标P的1/4分位数为-0.184,3/4分位数为0.220,本文将每个公司的盈利能力等级按照综合计量指标分为较弱、中等、较强三等分别用数字0,1,2表示,所有样本的分类结果在7个分项指标上的分布情况如图1、图2所示。数集的划分本文从两个角度出发,第一种本文将2010-2016年数据为样本训练集,2017与2018年数据为测试集,考虑模型的时效性;第二种本文将测算结果视为混合数据,仍然按照7:2的比例将数据划分为训练集与测试集,验证混合数据时的模型准确率。
图表编号 | XD00195060300 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.25 |
作者 | 张红、罗天 |
绘制单位 | 清华大学恒隆房地产研究中心 |
更多格式 | 高清、无水印(增值服务) |