《表3 数据集的分配状况及说明》
随后进行数据集抽取。乳腺癌分类属二元分类问题,故将数据内容定义为标准型数值{N,P},符合数据集要求。在实验设计过程中,将数据集分为训练集及测试集两部分。首先从数据清洗及查重后的数据集内抽取90%的数据作为训练集;在经数据清洗后的数据集内,随机抽取6份数据组成测试集(A~F),每份抽取10%的数据样本,特殊测试集1、特殊测试集2由两份单独的数据集组成,进行最后的模型评估。数据分布见表3。
图表编号 | XD0030334800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.15 |
作者 | 张旭东、孙圣力、王洪超 |
绘制单位 | 北京大学软件与微电子学院、北京大学软件与微电子学院、北京先通康桥医药科技有限公司 |
更多格式 | 高清、无水印(增值服务) |