《表2 金钱松测序数据转录本及Unigene组装统计》

《表2 金钱松测序数据转录本及Unigene组装统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《中国濒危植物金钱松转录组测序及生物信息学分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对测序所得的高质量数据进行de novo组装。首先,将具有一定重叠长度的clean reads组合形成重叠群(Contigs),即转录本不包含Gap的共有转录物片段,共获得了84 247条重叠群。为了检测重叠群来源于相同的转录本,将双末端读数(paired-end reads)映射回重叠群。每一个reads匹配不同的Contigs,通过Trinity软件将两个Contigs连接,得到84 247条转录本,总长度为67 383 281 bp,转录本的平均长度为800 bp,N50(累加转录本的长度不小于总长50%)的长度为1 503 bp(表2),取每条基因中最长的转录本作为Unigene进行后续分析。共得到70 761条Unigene,平均长度为699 bp,N50的长度为1 300 bp(表2)。转录本与Unigene长度分布比较接近,其中200~500 bp的Unigene最多,共有45 285条,占总数的65%;500~1 000 bp有11 065条Unigene,占总数的16%;1~2 kbp有9 162条Unigene,占总数13%,大于2 kbp的有5 249条,占总数的7%。从组装结果来看,不论是转录本还是Unigene,N50长度均大于其平均长度,且达到了1 kbp以上,说明组装效果比较好。