《表4 测试集中各并发症正负样本分布》

《表4 测试集中各并发症正负样本分布》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向非均衡数据的糖尿病并发症预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

针对实验对象数据不均衡的现象,数据集的采样方式对训练预测的结果起着至关重要的作用。若随机划分数据集,很有可能会导致各个集合的正负样本分布不均,很大概率测试集中正样本极少甚至无正样本,进而影响实验结果的有效性。为了确保测试集中具有一定比例的少数类样本,本文采用分层划分的方式,取30%的正样本和30%的负样本共同作为测试集,此时测试集中正样本数量、负样本数量,以及正样本所占比例如表4所示。