《表7 24维向量和16维向量对应的AUC<0.7的细菌个数比较Tab.7 AUCs comparison between24-D vector and 16-D vector》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于碱基组成和分布的DNA序列特征提取方法及应用》
文中构造的24维特征向量由碱基转移概率、含量和位置比三类特征组成,到底哪类特征在序列比较和必需基因识别中起到了主要作用呢?为了回答这个问题,我们单独考虑碱基转移概率这个特征,利用16维碱基转移概率向量分别构建了11物种的β-珠蛋白基因系统发生树和18种哺乳动物的系统发生树(见图5)。其中11物种的β-珠蛋白基因系统发生树和24维特征向量构造的系统发生树(图1)完全一样,而图5和图2也基本一致。从这组实验中可以看出转移概率在24维特征向量中所起到的重要作用。那么,是不是含量和位置比就可以忽略不计呢?利用16维向量重新识别了28株细菌的必需基因。表7展示了6组参数下两类向量对应的分类结果AUC<0.7的细菌个数情况。24维特征向量的整体识别效果要好于16维。所以含量和位置比这两个特征在必需基因识别问题中起到了一定的辅助作用。
图表编号 | XD0014161600 严禁用于非法目的 |
---|---|
绘制时间 | 2018.01.31 |
作者 | 李玉双、魏东、吕艳芬 |
绘制单位 | 燕山大学理学院、燕山大学理学院、燕山大学理学院 |
更多格式 | 高清、无水印(增值服务) |