《表2 三种方法的比较结果》
为了验证本置信度的决策树在客户价值分类中的有效性能,采用硬件实验环境为:Pentium(R)4,CPU2.40GHZ,,2G内存,软件环境:Windows XP和Matlab6.5,使用表1的数据集,分别使用置信度的决策树、C4.5算法和基于粗糙集的决策树进行训练预测,其结果如表2所示,采用置信度的决策树模型对该数据集进行预测分析,树形结构最简单,产生的规则数目最少,其规则泛化能力最强,不会出现不可分的对象组,也就是所有对象都可分类预测,有效地避免了由噪声数据带来的过拟合问题。而采用C4.5算法和基于粗糙集的决策树对该数据进行分析预测,获得的决策树相当复杂,产生的规则数目相对多,并且都或多或少存在不可预测的对象组。例如,在图2中,符合所获利润=“40”,并且购买频率=“4~8”的记录这些客户到底是低价值客户还是高价值客户呢?确定不了。
图表编号 | XD00100576400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 常志玲 |
绘制单位 | 洛阳师范学院信息技术学院 |
更多格式 | 高清、无水印(增值服务) |