《表2 RBKNN算法参数设置》
本文所提RBKNN算法的参数包括k'、MinRedund和MaxRmRate。其中k'为裁剪算法计算样本冗余度的范围,即统计k'个最近邻,MinRedund为样本裁剪最小冗余度,MaxRmRate为最大裁剪概率。对于最大裁剪概率的最优取值,本文在15个数据集上进行实验,观察MaxRmRate取值对算法精度的影响,实验结果如图3所示。由图可知,有些数据集冗余度较小,需要裁剪的样本较少,因此最大裁剪概率取值对其影响不大,而对于冗余度较大的数据集来说,存在一个最大裁剪概率的临界点,当最大裁剪概率小于此临界点时,最大裁剪概率取值对精度影响不大;当最大裁剪概率大于此临界点时,进入过度裁剪阶段,此时分类精度将会随着最大裁剪概率的增大而大幅下降。在实验中的所有数据集最大裁剪概率临界点均大于0.7,考虑到实验数据集覆盖范围较广,认为此结果具有普适性。因此,为保持分类器分类性能,在以下实验中,最大裁剪概率MaxRmRate均取0.7。RBKNN算法实验参数取值如表2所示。
图表编号 | XD00107089000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.15 |
作者 | 王子旗、何锦雯、蒋良孝 |
绘制单位 | 中国地质大学(武汉)计算机学院、中国地质大学(武汉)计算机学院、中国地质大学(武汉)计算机学院 |
更多格式 | 高清、无水印(增值服务) |