《表4 训练集与测试集的数据划分》

《表4 训练集与测试集的数据划分》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于随机森林的相邻区域地理标志大米产地确证方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本研究以R语言实现随机森林算法建模过程,建立梅河大米产地确证模型。为保证数据划分的随机性和一致性,运用sampling包中的strata()函数实现分层抽样,将原始数据集的166个样本以7∶3的比例划分为训练集和测试集,保证来自于梅河及相邻产区的大米样本比例一致,训练集样本116个用于模型的建立和优化,测试集样本50个用于外部精度检验,数据分布见表4。