《表2 四种癌症的四种组学数据维度信息》

《表2 四种癌症的四种组学数据维度信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《利用组学数据建立针对四种女性癌症的基于机器学习方法的生存预测模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

我们发现在组学数据中存在少量的缺失值,因此使用中值填补的方法进行缺失值弥补.针对DNA甲基化,miRNA,mRNA,RPPA数据特征列中存在的缺失值,用该列的中值填补.DNA甲基化、miRNA表达、mRNA表达、RPPA数据的特征维度信息(其中宫颈癌只有三种分子数据)如表2所示.这些分子数据经过标准化和缺失值弥补后,用于模型的建立.对于临床数据中字符串类型的特征,如肿瘤分期,由于其分期存在先后顺序,因此我们使用标签编码的方式对特征列进行编码.对于其中的缺失值,我们用特定的标签进行表示.