《表2 Credit Grade字段各等级属性信息》
信息增益筛选的主要过程为:建立信息函数,其中pi=ci/D,表示任意样本属于ci的概率,即信息熵,m为ci类别总数。同时对于维度A,建立信息函数。其中j表示维度A各属性值{a1,a2,…,av}中任意ai所带来的条件熵,两式之差Gain(A)=Info(D)-InfoA(D)即为维度A带来的信息增益。根据实际情况选取信息增益高的维度xi进行回归,这有助于加快分类器的学习速度。例如对样本的Credit Grade字段可以得到如表2所示的信息量表。
图表编号 | XD009913800 严禁用于非法目的 |
---|---|
绘制时间 | 2018.03.23 |
作者 | 张宁静、顾新、杨铖 |
绘制单位 | 四川大学商学院、四川大学商学院、广东金融学院保险学院 |
更多格式 | 高清、无水印(增值服务) |