《表2 金钱松测序数据转录本及Unigene组装统计》
对测序所得的高质量数据进行de novo组装。首先,将具有一定重叠长度的clean reads组合形成重叠群(Contigs),即转录本不包含Gap的共有转录物片段,共获得了84 247条重叠群。为了检测重叠群来源于相同的转录本,将双末端读数(paired-end reads)映射回重叠群。每一个reads匹配不同的Contigs,通过Trinity软件将两个Contigs连接,得到84 247条转录本,总长度为67 383 281 bp,转录本的平均长度为800 bp,N50(累加转录本的长度不小于总长50%)的长度为1 503 bp(表2),取每条基因中最长的转录本作为Unigene进行后续分析。共得到70 761条Unigene,平均长度为699 bp,N50的长度为1 300 bp(表2)。转录本与Unigene长度分布比较接近,其中200~500 bp的Unigene最多,共有45 285条,占总数的65%;500~1 000 bp有11 065条Unigene,占总数的16%;1~2 kbp有9 162条Unigene,占总数13%,大于2 kbp的有5 249条,占总数的7%。从组装结果来看,不论是转录本还是Unigene,N50长度均大于其平均长度,且达到了1 kbp以上,说明组装效果比较好。
图表编号 | XD0090528700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.20 |
作者 | 张文秀、张丽、寇一翾、张志勇 |
绘制单位 | 江西农业大学农学院、亚热带生物多样性实验室、江西农业大学农学院、亚热带生物多样性实验室、江西农业大学农学院、亚热带生物多样性实验室、江西农业大学农学院、亚热带生物多样性实验室 |
更多格式 | 高清、无水印(增值服务) |