《表4 不同特征选择算法随机森林分类精度比较》

《表4 不同特征选择算法随机森林分类精度比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于改进分离阈值特征优选的秋季作物遥感分类》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为比较Re EMISE算法特征选择效果,分别与Relief F算法和EMISE算法的随机森林分类精度比较。同时与支持向量机分类法比较,验证随机森林处理高维小样本数据的性能。4种不同实验的分类结果见图4,通过目视解译法与原始图像比较,RF_Relief F和SVM_Re EMISE椒盐现象严重,右下角的梨园存在严重的错分情况,见图6。为定量评价不同实验的分类精度,实验评价指标包括总体分类精度、错分误差、漏分误差和Kappa系数。由表4可知,在特征变量9个时,Re EMISE算法达到最高分类精度,其总体精度和Kappa系数分别为95.391 8%和0.939 7,相比EMISE算法和Relief F算法总体分类精度分别提高1.654 9%和24.036 8%,Kappa系数提高0.021 6和0.309 6。Relief F算法在特征变量18个时达到最高精度,其总体精度和Kappa系数分别为95.340 3%和0.939。Relief F算法在特征变量45个时达到最高精度,其总体精度和Kappa系数分别为95.315%和0.938 7。由于前9个特征重要性得分高,3种算法分类精度指标都快速上升。Re EMISE算法在9个特征达到最高精度,然后随着特征增加,特征之间出现冗余并且重要性降低,造成精度下降。Relief F算法特征变量在9~18之间精度指标逐渐上升达到最高,然后处于波动状态。EMISE算法特征变量9个之后精度指标逐渐缓慢上升,45个时达到最高精度,然后略有下降。从图7可以直观看出,利用Re EMISE特征优选算法提取农作物,每种类别的错分误差和漏分误差都小于其他算法。Re EMISE算法错分误差和漏分误差最大的是小宗作物分别为30.24%和11.60%,与EMISE算法相比错分误差降低6个百分点,漏分误差降低8.43个百分点。与Relief F算法相比错分误差降低19.02个百分点,漏分误差降低15.18个百分点。由以上得出,Re EMISE算法选择子集最优,主要包括2个方面:(1)最高精度时特征变量数量最少。(2) 3种算法不同特征变量数量达到最高精度时Re EMISE算法分类精度指标最高。在Re EMISE特征选择下,比较随机森林分类器和支持向量机分类器性能。随机森林9个特征变量时达到最高精度,比支持向量机总体精度提高16.96%,Kappa系数提高0.219 1。支持向量机分类法在特征变量33个时达到最高精度,总体精度和Kappa系数分别为95.135 9%和0.936 5。由表4看出,随机森林分类器总体上优于支持向量机分类器。采用i7 9750H CPU,16 GB内存的测试环境,随机森林分类时,183个特征全部参与分类用时610 s,9个特征分类用时123 s。支持向量机法在最高精度33个特征时分类用时542 s。Re EMISE降维算法能在保证精度下提高分类速度。