《表3 WCDT与其他决策树对比正确率》
表4展示了这些决策树在10个数据集上的模型复杂度(树的结点个数),最好的结果被标红显示。从产生结点个数的平均值来看,3个斜划分算法产生的决策树的结点数量确实比2个轴平行划分算法要少。但是,在对平均序值进行Nemenyi后续检验时发现(Friedman检验结果拒绝“所有算法性能相同”的假设),所有算法生成的树的结点个数并没有显著差异。造成这种情况出现的原因是,本文报告的测试正确率和结点个数是在这些决策树被剪枝后得到的结果。不论是轴平行树还是斜树,也不论采用哪种剪枝策略,剪枝操作都将减掉树中的一些结点,简化模型的同时也避免过拟合现象的出现。由于本文的重点在于决策树划分方法,因此剪枝方法的问题不再赘述。
图表编号 | XD00183765100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.28 |
作者 | 刘振宇、褚娜 |
绘制单位 | 东北大学计算机科学与工程学院、大连东软信息学院计算机与软件学院、大连东软信息学院计算机与软件学院 |
更多格式 | 高清、无水印(增值服务) |