《表2 HCC分期识别的混淆矩阵》
本系列图表出处文件名:随高清版一同展现
《基于Wasserstein GAN的新一代人工智能小样本数据增强方法——以生物领域癌症分期数据为例》
具体而言,当生成模拟样本数量为4000时,原始样本的测试准确率为70.97%(31个原始样本,22个预测正确),F-measure为70.07%,G-mean为68.39%。这时,DNN对癌症每一个时期的预测情况如表2所示。具体而言,当生成模拟样本数量为4000时,原始样本的测试准确率为70.97%(31个原始样本,22个预测正确),F-measure为70.07%,G-mean为68.39%。这时,DNN对癌症每一个时期的预测情况如表2所示。作为对照组的健康测试样本全部预测正确,8个TNM I期的测试样本有5个预测正确,有2个被预测为TNM II期,有1个被预测为TNM III期。10个TNM II期的测试样本有7个预测正确,有2个被错误的预测为健康样本,这以结果可能会带来比较大的漏诊风险,需要在未来的预测中对TNM II期样本保持关注,另外,还有1个样本被错误的预测为TNM III期。6个TNM III期样本只有3个被预测正确,另外3个样本被预测为TNM I期,对TNM III期样本的预测准确率只有50%,这也拉低了DNN分类器整体的预测准确率,在未来的研究中需要尝试增加TNM III期的原始训练样本数量,进一步提高DNN模型对TNM III期的特异性学习能力。根据生物学,因为TNM I期和II期具有类似的临床表征,可以将其归为一类,共称为癌症的早期。从对于肝细胞癌早期的预测效果来看,共18个癌症早期测试样本,有14个预测正确,预测准确率达到了77.78%,超过了分类器总体的预测准确率,这对于肝癌的早期识别与治疗有重要意义,因为目前的研究发现,对肝癌的早期治疗能够显著提高患者的存活率[69]。Holzinger等[70]最近的一项研究表示如果机器学习能够为数字化病理学提供帮助,将会显著改变病理学家的医学研究流程。因此,对癌症分期的准确预测为进一步研究肝癌的致病机理提供了可能性。
图表编号 | XD0061018800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.02.01 |
作者 | 刘宇飞、周源、刘欣、董放、王畅、王子鸿 |
绘制单位 | College of Life Science and Technology,Huazhong University of Science and Technology、School of Public Policy and Management,Tsinghua University、Center for Strategic Studies,Chinese Academy of Engineering、School of Public Policy and Management,Tsinghua Uni |
更多格式 | 高清、无水印(增值服务) |