《表1 7×2BCV切分方式的拼合规则》

《表1 7×2BCV切分方式的拼合规则》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向文本数据的正则化交叉验证方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

给定正则化条件Φ(0)后,Wang等提出了一种块正则化的m×2交叉验证方法(block-regularized m×2cross-validation,简记为m×2BCV),并采用了分块嵌套的方式来构造数据切分算法[11]。简单来说,就是先将数据集逐块等分(样本数相等),即一块分二块、二块分四块,形成“嵌套”的数据子块;然后基于这样的数据子块,利用二水平正交表的均衡性,构造出满足关于Φ(0)正则化条件的切分。这样的构造方法是一种增量式构造,即可以保证已构造出来的切分不变,逐步加入新的切分,最终形成m组训练集和验证集。具体地,当m=3时,构造3×2BCV的切分,可将数据集D划分成大小相同的4份,然后任取两份作为训练集,其他两份作为验证集,形成的6次实验对应3组2折交叉验证。当m>3时,构造m×2BCV的切分需借助二水平正交表。以7×2BCV为例,基于二水平正交表OA(8,7),将数据集等分为8块,记为Ik(8),k=1,2,…,8,然后根据表1所示规则可拼合成对应的7组训练集和测试集。