《表4 对比不同交叉验证方法》
常见的交叉验证有三种方法:第一种为Hold-Out方法,该方法将原始数据随机分成两组,一组为训练集,另一组为测试集。利用训练集训练得到评价模型,再用测试集测试模型,测试集所得到的性能指标即为模型的性能指标。第二种为K折交叉验证(K-fold Cross Validation,K-CV),该方法首先将整个数据集平均分成K组,然后将每组数据分别作为一次测试集,剩余的K-1组数据作为训练集,可以得到K个模型。计算K个模型中每个测试集得到的平均指标即为整个模型的性能指标。通常K值选取大于等于2,当K取2时,即为Hold-Out方法。第三种为留一交叉验证(Leave-One-Out Cross Validation,LOO-CV),一般假设某个数据集有M个样本,将每个样本单独作为测试集,剩余的M-1个样本作为训练集,可以得到M个模型。M个模型中每个测试集的平均性能指标作为整个模型的性能指标。表4对比了不同交叉验证方式的优点和不足。
图表编号 | XD0035438900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.02.15 |
作者 | 张凯兵、朱丹妮、王珍、闫亚娣 |
绘制单位 | 西安工程大学电子信息学院、西安工程大学电子信息学院、西安工程大学电子信息学院、西安工程大学电子信息学院 |
更多格式 | 高清、无水印(增值服务) |