《表4 测试集中各并发症正负样本分布》
针对实验对象数据不均衡的现象,数据集的采样方式对训练预测的结果起着至关重要的作用。若随机划分数据集,很有可能会导致各个集合的正负样本分布不均,很大概率测试集中正样本极少甚至无正样本,进而影响实验结果的有效性。为了确保测试集中具有一定比例的少数类样本,本文采用分层划分的方式,取30%的正样本和30%的负样本共同作为测试集,此时测试集中正样本数量、负样本数量,以及正样本所占比例如表4所示。
图表编号 | XD00212875000 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.25 |
作者 | 邱云飞、郭蕾 |
绘制单位 | 辽宁工程技术大学软件学院、辽宁工程技术大学软件学院 |
更多格式 | 高清、无水印(增值服务) |