《表2 碳强度因子指标数量与样本均值的Gini系数减小值》

《表2 碳强度因子指标数量与样本均值的Gini系数减小值》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《中国碳强度关键影响因子的机器学习识别及其演进》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在已完成的节点分裂属性划分的数据集中,Gini系数大小反映了决策树属性划分的纯度,Gini系数越小,决策树节点划分的纯度越大,对森林中所有决策树的节点变量进行属性划分,计算平均Gini系数的减小程度,当减小程度很大时,表示森林中所有决策树平均纯度大幅提高,表明该节点变量对森林的影响很大。因此只要计算每个数据集中不同指标的Gini系数减小值,根据Gini系数减小值可以评价出1980-2014年中国碳强度影响因子指标逐年的重要程度。由于随机森林中Gini系数是基于信息熵计算获得,根据熵值可加性,意味着所有影响因子的Gini系数减小值总和也就代表了整个碳强度因子指标体系的重要性。因此,为统一设定中国碳强度关键因子筛选的指标数量阈值,对1980-2014年每年各项指标的Gini系数减小值均由大到小排序,再计算各项指标在1980-2014年的平均值,得到碳强度因子指标数量与样本均值的Gini系数减小值对应关系(表2)。