《表2 七项特征相对于分类器响应变量的标准化互信息值和预测重要度》

《表2 七项特征相对于分类器响应变量的标准化互信息值和预测重要度》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于用电特征单一视角数据的中小企业生命周期阶段识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了验证上述7项特征与企业生命周期划分之间存在某种内在关联,本文分别从数据分布是否独立和特征对模型预测能力贡献大小的角度,计算了所有特征与2.1节中构造的分类器响应变量之间的标准化互信息值和特征重要度,结果见表2所示。从互信息值来看,所有特征在一定程度上都与分类器响应变量之间存在浅层相关性(互信息值为0代表两个变量独立)。从重要度排序来看,用电量的季平均变化率特征贡献了最大的26%,这是符合人们常理判断的。而且,这7项特征在重要度上具有长尾效应,即没有绝对突出贡献的特征,因此它们必须一同参考进来。另外,通过对比发现,尽管季度用电量曲线模式和用电行为模式这两项特征的互信息值比较低,但是它们的特征重要度相较而言都比较显著。这表明本文所采用的分类器模型已经捕捉到了特征与企业生命周期阶段之间的深度关联关系。这也印证了本文利用K-means聚类技术挖掘提取季度用电量曲线模式和用电行为模式这两项定类特征的必要性。