《表7 24维向量和16维向量对应的AUC<0.7的细菌个数比较Tab.7 AUCs comparison between24-D vector and 16-D vector》

《表7 24维向量和16维向量对应的AUC<0.7的细菌个数比较Tab.7 AUCs comparison between24-D vector and 16-D vector》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于碱基组成和分布的DNA序列特征提取方法及应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

文中构造的24维特征向量由碱基转移概率、含量和位置比三类特征组成,到底哪类特征在序列比较和必需基因识别中起到了主要作用呢?为了回答这个问题,我们单独考虑碱基转移概率这个特征,利用16维碱基转移概率向量分别构建了11物种的β-珠蛋白基因系统发生树和18种哺乳动物的系统发生树(见图5)。其中11物种的β-珠蛋白基因系统发生树和24维特征向量构造的系统发生树(图1)完全一样,而图5和图2也基本一致。从这组实验中可以看出转移概率在24维特征向量中所起到的重要作用。那么,是不是含量和位置比就可以忽略不计呢?利用16维向量重新识别了28株细菌的必需基因。表7展示了6组参数下两类向量对应的分类结果AUC<0.7的细菌个数情况。24维特征向量的整体识别效果要好于16维。所以含量和位置比这两个特征在必需基因识别问题中起到了一定的辅助作用。