《表1 癌症数据集统计信息》
本文从TCGA数据库网站(https://tcga-data.nci.nih.gov/tcga)分别下载了乳腺癌(BReast invasive CArcinoma,BRCA)、肝癌(LIver Hepatocellular Carcinoma,LIHC)和子宫内膜癌(Uterine Corpus Endometrial Carcinoma,UCEC)的基因表达数据和异构体表达数据,使用TPM(Transcripts Per Million)来衡量样本的表达丰度。且从TCGA Splice Seq网站(https://bioinformatics.mdanderson.org/TCGASpliceSeq/)获取相应癌症样本各基因的剪接模式PSI表达数据。由于过低表达量的基因或异构体在癌症调控过程中往往起不到调节作用,且发生可变剪接的基因至少含2个异构体。本文筛选在50%以上样本中表达量至少为0.1 TPM的异构体,再剔除掉只有单个异构体的基因,最终各癌症数据集的样本个数、基因个数和对应的异构体个数如表1所示。
图表编号 | XD00151368700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.01 |
作者 | 刘文斌、王兵、方刚、石晓龙、许鹏 |
绘制单位 | 温州大学计算机与人工智能学院、广州大学计算科技研究院、温州大学计算机与人工智能学院、广州大学计算科技研究院、广州大学计算科技研究院、广州大学计算科技研究院、黔南民族师范学院计算机与信息学院 |
更多格式 | 高清、无水印(增值服务) |