《表2 基因注释成功率统计》

《表2 基因注释成功率统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《黄麻(Corchorus capsularis L.)干旱胁迫转录组初步分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了更好地分析转录组序列所涉及的基因功能信息,需要对拼接得到的23 297条基因进行注释。共使用7个公共数据库,对这些基因中进行了不同程度的注释(表2)。在Nr数据库注释结果中,有84.9%的序列与目标序列相似度超过80%(图2A),且77.8%的序列比对结果e值小于10~60 (图2B)。在这些序列注释结果中,大部分(74.5%)目标序列均来源于黄麻属(图2C),说明本次转录组测序结果较好,整体注释信息可靠。在GO注释中,注释结果被分为三大类,分别是生物进程(biological process,BP)、细胞组件(cellular component,CC)和分子功能(molecular function,MF)。所有基因的GO注释结果均体现在这三种类别中。在BP中,被注释最多的三个类别是细胞过程(Cellular process)、代谢过程(Metabolic process)和信号-器官过程(Signal-organism process);在CC中,富集最多基因的三个类别是细胞(Cell)、细胞组分(Cell part)和细胞器(Organelle);在MF中,结合(Binding)和催化活性(Catalytic activity)囊括了该转录组基因的大部分分子功能(图3)。在KOG数据库分类中,共有5 904条基因被注释到25个KOG类别中,其中被注释基因最多的三个类别是O:翻译后修饰:蛋白开关和分子伴侣(721条基因)、R:总体功能预测(720条基因)和J:翻译:核糖体结构与生物发生(476条基因,图4)。从代谢角度分析这些基因,发现被注释信息最多的三个条目依次是“遗传信息处理”大类中的“翻译”、“代谢”大类中的“碳水化合物代谢”和“遗传信息处理”中的“折叠,排列和降解”(图5)。最后,为了更详细地了解本次转录组测序所得到的信息,对所得到的基因中可能编码的转录因子进行了预测。共有386条基因被注释到46个转录因子家族(图6),其中基因数目最多的转录因子家族是b HLH家族(32条基因)、C2H2家族(23条基因)和b ZIP及WRKY家族(各22条基因)。最后,对转录组测序结果中SSR信息进行分析表明,整体SSR重复序列分布趋势(图7A)与转录因子编码基因序列中的趋势(图7B)呈现相似分布。