《表1 预测过程的流程:基于比较基因组学的簸箕柳DNA模体预测》

《表1 预测过程的流程:基于比较基因组学的簸箕柳DNA模体预测》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于比较基因组学的簸箕柳DNA模体预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在分子生物学中,同源性,即高度相关的结构和功能,一直是研究热点。蛋白质和DNA都是线性序列,可以认为序列中的字符顺序是表达了特定功能的基本块,因此尽管模体只有一小段序列,但是可以认为它是“通用序列”。所以,模体是在基因研究中一种典型的基于位置的表达[11],它是一个分子家族的关键性位置的标记。围绕如何发现模体的问题,3种主流的生物学已经相对成熟[12]:1) 原始模体发现法(de novo Motif Finding)[13];2) 模体实体扫描法,即在特定启动区扫描和查找模体[14];3) 计算机模体发现算法,利用统计方法对预测可靠性进行评估[15]。近几年,一批专门用于模体发现的算法被发布,包括RBP-motif[16]、DRIMUST[17]和MEME suite[18],其中利用MEME进行模体发现是应用最广泛的方法。平行地,一批模体数据库也被建立,例如:TRANSFAC[19]、JASPAR[20]、cisRED[21]和最新的TFBSshape[22]。在这些数据库中,TRANS-FAC和JASPAR也是著名的转录因子数据库(TF Database),收录并维护了一大批被生物试验验证了的序列数据。表1列出了一些重要的模体发现软件、服务及数据库。该研究设计了一种新的计算机模体发现算法,即基于位置的基因序列匹配算法,对簸箕柳的DNA模体进行了预测。该研究使用了美国俄亥俄州立大学的AtcisDB项目的数据[23],该项目发布了模式生物拟南芥(Arabidopsis thaliana)的最新调控网络,其中AtcisDB中收集了超过33 000个调控元件,AtFTDB将1 770个转录因子分为50个小类,AtRegNet记录了16 184个调控关系。