《表2 整合数据集的详细信息》

《表2 整合数据集的详细信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《用于样本聚类和网络分析的整合鲁棒结构化NMF模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文将胰腺癌(pancreatic adenocarcinoma,PAAD)、食管癌(esophagealcarcinoma,ESCA)、头颈麟癌(head and neck squamous cell carcinoma,HNSC)和结直肠癌(colon adenocarcinoma,COAD)4个数据集中任意3个进行整合,从而获得PAAD_ESCA_HNSC(PEH)、PAAD_ESCA_COAD (PEC)、PAAD_HNSC_COAD (PHC)和ESCA_HNSC_COAD(EHC)4个数据集.每种癌症的原始数据可从TCGA(https://tcgadata.nci.nih.gov/tcga/)下载得到.最终的整合数据集均包含3种数据类型,即基因表达(gene expression,GE)、甲基化(methylation,ME)、拷贝数变异(copy number variation,CNV).在数据预处理部分,首先对整合数据集进行降维以摒除冗余信息,然后将处理后的数据归一化.具体的数据集信息如表2所示.