《表1 癌症数据集统计信息》

《表1 癌症数据集统计信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于中值的JS散度可变剪接差异分析研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文从TCGA数据库网站(https://tcga-data.nci.nih.gov/tcga)分别下载了乳腺癌(BReast invasive CArcinoma,BRCA)、肝癌(LIver Hepatocellular Carcinoma,LIHC)和子宫内膜癌(Uterine Corpus Endometrial Carcinoma,UCEC)的基因表达数据和异构体表达数据,使用TPM(Transcripts Per Million)来衡量样本的表达丰度。且从TCGA Splice Seq网站(https://bioinformatics.mdanderson.org/TCGASpliceSeq/)获取相应癌症样本各基因的剪接模式PSI表达数据。由于过低表达量的基因或异构体在癌症调控过程中往往起不到调节作用,且发生可变剪接的基因至少含2个异构体。本文筛选在50%以上样本中表达量至少为0.1 TPM的异构体,再剔除掉只有单个异构体的基因,最终各癌症数据集的样本个数、基因个数和对应的异构体个数如表1所示。