《表1 混淆矩阵:一种改进型的不平衡数据欠采样算法》
传统的学习任务采用精度作为分类器性能好坏的评价标准,但由于不平衡数据集的特殊性,分类器更偏向将结果预测为多数类从而获得较高的精确度.但是在一些情况下,不能识别少数类的分类并不是我们想要的,所以将精度作为不平衡数据集中分类器的评价标准是不合适的.为此,一些学者提出了更完善的解决方案,如F-Measure[9],G-Mean[10].这些指标都基于分类评价中常用的混淆矩阵(confusion matrix),根据分类器预测结果与实际情况划别4类组合,真正例(true positive),假正例(false positive),真反例(true negative),假反例(false negative).混淆矩阵如表1所示.
图表编号 | XD0045034100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.01 |
作者 | 魏力、张育平 |
绘制单位 | 南京航空航天大学计算机科学与技术学院、南京航空航天大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |