《表1 剔除信息缺失序列后的外显子和内含子数据分布表》

《表1 剔除信息缺失序列后的外显子和内含子数据分布表》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《DBN在蛋白质编码区识别问题中的应用研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对于蛋白质编码区的识别问题,本文主要是对真核生物的DNA序列进行判别分析,因此使用的数据也是真核生物的DNA序列,包括BG570、HMR195以及GENSCAN65数据。数据的主要来源是BG570数据集(http://www1.imim.es/databases/genomics96/),HMR195数据集(http://www.cs.ubc.ca/~rogic/evaluation/),GEN-SCAN65数据集(http://www.ncbi.nlm.nih.gov/nuccore/FO081497),这里统称它们为原始数据。因为原始数据中有部分DNA序列是小于20bp的,这些数据包含的信息是不全面的,所以本文首先将这些数据从数据集中剔除,然后从原始数据中选取长度为20bp以上的外显子和内含子。新建的基本数据集中外显子和内含子的个数如表1所示。