《表1 7×2BCV切分方式的拼合规则》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《面向文本数据的正则化交叉验证方法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

给定正则化条件Φ（0）后，Wang等提出了一种块正则化的m×2交叉验证方法（block-regularized m×2cross-validation，简记为m×2BCV），并采用了分块嵌套的方式来构造数据切分算法[11]。简单来说，就是先将数据集逐块等分（样本数相等），即一块分二块、二块分四块，形成“嵌套”的数据子块；然后基于这样的数据子块，利用二水平正交表的均衡性，构造出满足关于Φ（0）正则化条件的切分。这样的构造方法是一种增量式构造，即可以保证已构造出来的切分不变，逐步加入新的切分，最终形成m组训练集和验证集。具体地，当m=3时，构造3×2BCV的切分，可将数据集D划分成大小相同的4份，然后任取两份作为训练集，其他两份作为验证集，形成的6次实验对应3组2折交叉验证。当m>3时，构造m×2BCV的切分需借助二水平正交表。以7×2BCV为例，基于二水平正交表OA（8，7），将数据集等分为8块，记为Ik（8），k=1，2，…，8，然后根据表1所示规则可拼合成对应的7组训练集和测试集。

图表编号	XD0054902400 严禁用于非法目的
绘制时间	2019.05.01
作者	王瑞波、王钰、李济洪
绘制单位	山西大学软件学院、山西大学软件学院、山西大学软件学院
更多格式	高清、无水印（增值服务）