《表2 基因注释成功率统计》
本系列图表出处文件名:随高清版一同展现
《黄麻(Corchorus capsularis L.)干旱胁迫转录组初步分析》
为了更好地分析转录组序列所涉及的基因功能信息,需要对拼接得到的23 297条基因进行注释。共使用7个公共数据库,对这些基因中进行了不同程度的注释(表2)。在Nr数据库注释结果中,有84.9%的序列与目标序列相似度超过80%(图2A),且77.8%的序列比对结果e值小于10~60 (图2B)。在这些序列注释结果中,大部分(74.5%)目标序列均来源于黄麻属(图2C),说明本次转录组测序结果较好,整体注释信息可靠。在GO注释中,注释结果被分为三大类,分别是生物进程(biological process,BP)、细胞组件(cellular component,CC)和分子功能(molecular function,MF)。所有基因的GO注释结果均体现在这三种类别中。在BP中,被注释最多的三个类别是细胞过程(Cellular process)、代谢过程(Metabolic process)和信号-器官过程(Signal-organism process);在CC中,富集最多基因的三个类别是细胞(Cell)、细胞组分(Cell part)和细胞器(Organelle);在MF中,结合(Binding)和催化活性(Catalytic activity)囊括了该转录组基因的大部分分子功能(图3)。在KOG数据库分类中,共有5 904条基因被注释到25个KOG类别中,其中被注释基因最多的三个类别是O:翻译后修饰:蛋白开关和分子伴侣(721条基因)、R:总体功能预测(720条基因)和J:翻译:核糖体结构与生物发生(476条基因,图4)。从代谢角度分析这些基因,发现被注释信息最多的三个条目依次是“遗传信息处理”大类中的“翻译”、“代谢”大类中的“碳水化合物代谢”和“遗传信息处理”中的“折叠,排列和降解”(图5)。最后,为了更详细地了解本次转录组测序所得到的信息,对所得到的基因中可能编码的转录因子进行了预测。共有386条基因被注释到46个转录因子家族(图6),其中基因数目最多的转录因子家族是b HLH家族(32条基因)、C2H2家族(23条基因)和b ZIP及WRKY家族(各22条基因)。最后,对转录组测序结果中SSR信息进行分析表明,整体SSR重复序列分布趋势(图7A)与转录因子编码基因序列中的趋势(图7B)呈现相似分布。
图表编号 | XD00189158300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.14 |
作者 | 金关荣、陈杰、安霞 |
绘制单位 | 浙江省萧山棉麻研究所浙江省农业科学院花卉研究开发中心、华中农业大学生命科学技术学院、浙江省萧山棉麻研究所浙江省农业科学院花卉研究开发中心 |
更多格式 | 高清、无水印(增值服务) |