《表1 蛋白质序列特征提取方法对比》

《表1 蛋白质序列特征提取方法对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《优化多核SVM的蛋白质二级结构预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

氨基酸理化性质特征常用于蛋白结构和性能预测。氨基酸的8种理化特性包括溶解性、酸碱性质、亲水疏水性、侧链质量等。序列中每个氨基酸对应一个8维的向量。构成蛋白质多肽链的基本氨基酸类型有20种,由于蛋白质序列中可能存在一些未知的氨基酸,在此使用21个元素的独热编码来指示序列中某一位置的氨基酸类型。文中,将来自不同源的特征连接成单个特征向量。训练数据被归一化为具有零均值和单位方差的数据,1个氨基酸残基由49维特征(20维PSSM、8维物理特性和21维蛋白质编码信息)表示,对应的标签是三种结构标签,如表1所示。