《表1 蛋白质序列特征提取方法对比》
氨基酸理化性质特征常用于蛋白结构和性能预测。氨基酸的8种理化特性包括溶解性、酸碱性质、亲水疏水性、侧链质量等。序列中每个氨基酸对应一个8维的向量。构成蛋白质多肽链的基本氨基酸类型有20种,由于蛋白质序列中可能存在一些未知的氨基酸,在此使用21个元素的独热编码来指示序列中某一位置的氨基酸类型。文中,将来自不同源的特征连接成单个特征向量。训练数据被归一化为具有零均值和单位方差的数据,1个氨基酸残基由49维特征(20维PSSM、8维物理特性和21维蛋白质编码信息)表示,对应的标签是三种结构标签,如表1所示。
图表编号 | XD00139797100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.15 |
作者 | 刘斌、温雪岩 |
绘制单位 | 陕西科技大学电子信息与人工智能学院、陕西科技大学电子信息与人工智能学院 |
更多格式 | 高清、无水印(增值服务) |