《表1 样本包含的特征属性及其含义》

《表1 样本包含的特征属性及其含义》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于XGBoost的乳腺癌预测模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验过程中采用的数据集是由美国Wisconsin医院的William H.Wolberg博士贡献在UCI上的临床案例数据集[6],数据集中包含的属性特征是从病人乳房肿块的细针穿刺(FNA)的数字图像中计算得到的。该数据集总共包含699个样本,经过医疗领域的专家诊断结果将样本进行了划分,数据集中前9列记录了每个样本对应的属性特征值,最后一列即为专家诊断的最终结果。原始数据集中用2表示良性肿瘤,用4表示恶性肿瘤,实验时修改了类别标签,处理后的数据集中用标签1代表恶性(Malignant),标签0表示良性(Benign)。统计结果显示,在数据集中有458个样本被诊断为良性,剩下的241个样本被诊断为恶性,诊断结果中两个类别所占比例如图1所示。实验数据集样本的特征属性如表1。