《表2 Credit Grade字段各等级属性信息》

《表2 Credit Grade字段各等级属性信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《P2P校园贷款个人违约风险因素指标探析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

信息增益筛选的主要过程为:建立信息函数,其中pi=ci/D,表示任意样本属于ci的概率,即信息熵,m为ci类别总数。同时对于维度A,建立信息函数。其中j表示维度A各属性值{a1,a2,…,av}中任意ai所带来的条件熵,两式之差Gain(A)=Info(D)-InfoA(D)即为维度A带来的信息增益。根据实际情况选取信息增益高的维度xi进行回归,这有助于加快分类器的学习速度。例如对样本的Credit Grade字段可以得到如表2所示的信息量表。