《表2 各等级样本数据量分布》
由于肺结节相对于整张CT图像来说,面积占比往往非常小,既使是恶性结节,也只占很小一部分,肺实质等构造对模型的训练会产生一定程度的影响;此外,良性结节的图像数量往往多于恶性结节的,这种类别不平衡也会影响分类性能.因此,本研究采用以下预处理方法:对原始图片进行像素提取,以去除原始结节中潜在的冗余信息,每张图片的大小最终为64×64像素.随机选取部分图像并对每张图像都进行-10°、-5°、5°和10°的旋转操作,再采用增加高斯噪声和椒盐噪声的方法对图像进行变换,以增强模型的鲁棒性.预处理后每类结节图像数量相等,共包含16 385张肺结节图像,由于评分为3的未知等级的结节存在不确定性,影响模型的训练效果,因此,本研究仅从这些样本中取评分为1和2的结节将其划分为良性,评分4和5的结节划分为恶性,最终每个等级样本分布情况如表2.
图表编号 | XD00172423700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.30 |
作者 | 顾军华、孙哲然、王锋、戚永军、张亚娟 |
绘制单位 | 河北工业大学河北省大数据计算重点实验室、河北工业大学人工智能与数据科学学院、河北工业大学河北省大数据计算重点实验室、河北工业大学电子信息工程学院、河北工业大学河北省大数据计算重点实验室、河北工业大学人工智能与数据科学学院、河北工业大学河北省大数据计算重点实验室、北华航天工业学院信息技术中心、河北工业大学河北省大数据计算重点实验室、河北工业大学人工智能与数据科学学院 |
更多格式 | 高清、无水印(增值服务) |