《表2 四种癌症的四种组学数据维度信息》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《利用组学数据建立针对四种女性癌症的基于机器学习方法的生存预测模型》
我们发现在组学数据中存在少量的缺失值,因此使用中值填补的方法进行缺失值弥补.针对DNA甲基化,miRNA,mRNA,RPPA数据特征列中存在的缺失值,用该列的中值填补.DNA甲基化、miRNA表达、mRNA表达、RPPA数据的特征维度信息(其中宫颈癌只有三种分子数据)如表2所示.这些分子数据经过标准化和缺失值弥补后,用于模型的建立.对于临床数据中字符串类型的特征,如肿瘤分期,由于其分期存在先后顺序,因此我们使用标签编码的方式对特征列进行编码.对于其中的缺失值,我们用特定的标签进行表示.
图表编号 | XD0066448500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.20 |
作者 | 桑浩凯、郭树理、曲红、赵敏、曲大成 |
绘制单位 | 北京理工大学计算机学院、北京理工大学自动化学院北京理工大学复杂系统智能控制与决策教育重点实验室、北京大学生命科学学院生物信息中心蛋白质与植物基因研究国家重点实验室、School of Engineering,Faculty of Science,Health,Education and Engineering,University of the Sunshine Coast、北京理工大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |