《表2 RBKNN算法参数设置》

《表2 RBKNN算法参数设置》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于冗余度的KNN训练样本裁剪新算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文所提RBKNN算法的参数包括k'、MinRedund和MaxRmRate。其中k'为裁剪算法计算样本冗余度的范围,即统计k'个最近邻,MinRedund为样本裁剪最小冗余度,MaxRmRate为最大裁剪概率。对于最大裁剪概率的最优取值,本文在15个数据集上进行实验,观察MaxRmRate取值对算法精度的影响,实验结果如图3所示。由图可知,有些数据集冗余度较小,需要裁剪的样本较少,因此最大裁剪概率取值对其影响不大,而对于冗余度较大的数据集来说,存在一个最大裁剪概率的临界点,当最大裁剪概率小于此临界点时,最大裁剪概率取值对精度影响不大;当最大裁剪概率大于此临界点时,进入过度裁剪阶段,此时分类精度将会随着最大裁剪概率的增大而大幅下降。在实验中的所有数据集最大裁剪概率临界点均大于0.7,考虑到实验数据集覆盖范围较广,认为此结果具有普适性。因此,为保持分类器分类性能,在以下实验中,最大裁剪概率MaxRmRate均取0.7。RBKNN算法实验参数取值如表2所示。