《表1 查重前后阳性数据:基于数据挖掘的触诊成像乳腺癌智能诊断模型和方法》
整个数据集内初始的阳性样本有135个,占所有数据的0.85%。由于阳性数据与阴性数据的比例极不平衡,故而进行了样本数据的整理。在数据查重时,发现排除位置及象限两个不影响结果的属性后,有168个阴性数据与阳性数据属性相同。为避免错失恶性病例情况的发生,将这168个原本标为阴性而实则为阳性的数据样本更改成阳性,以提高数据的准确性。查重前后阳性数据数量见表1。
图表编号 | XD0030334500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.15 |
作者 | 张旭东、孙圣力、王洪超 |
绘制单位 | 北京大学软件与微电子学院、北京大学软件与微电子学院、北京先通康桥医药科技有限公司 |
更多格式 | 高清、无水印(增值服务) |