《表1 金钱松测序产出数据质量评估》

《表1 金钱松测序产出数据质量评估》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《中国濒危植物金钱松转录组测序及生物信息学分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
Q20、Q30:Phred数值大于20、30的碱基占总体碱基的百分比;GC content:碱基G和C的数量总和占总的碱基数量的百分比

从金钱松cDNA文库高通量测序中共获得了49 521 192个原始读数,去除带有接头的、低质量的以及N的比例大于10%的reads,得到了47 477 676条clean reads,总长7.12 Gb,Q30(碱基正确识别率达99.9%)高质量序列占91.29%,Q20(碱基正确识别率达99%)序列占96.59%,GC含量占总碱基46.32%,碱基错误率为0.02%,低于1%(表1)。说明通过Illumina HiSeqTM2500平台测序得到的金钱松数据质量比较高,满足后续生物信息学分析。