《表2 机器学习指导蛋白质设计应用》
目前尚未有任何一种普适的学习算法,可以应对所有的学习任务,在蛋白质设计改造领域亦是如此。因此,科研工作者需要在相应的情况下,通过测试比对等方式选用合适的算法进行设计[84]。常见算法包括线性模型(Linear models)、随机森林(Random forests)、支持向量机(Support vector machines)、高斯过程(Gaussian processes)等。以Frances H.Arnold团队近期改造一氧化氮双加氧酶(NOD)立体选择性的工作为例,先后通过K最近邻、线性模型、决策树、随机森林等多个算法构建NOD的立体选择性催化模型,将76%(S)-ee初始突变体提升至93%(S)-ee及反转至79%(R)-ee[85]。此外,表2列举了近十几年来机器学习指导蛋白质设计的应用实例,涉及蛋白质的热稳定性、催化活性、对映体选择性、光敏性及可溶性等多个方面。从中不难看出,机器学习的可应用性非常强,各常用算法均可覆盖某些蛋白质性能的改造。
图表编号 | XD00105496500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.25 |
作者 | 曲戈、朱彤、蒋迎迎、吴边、孙周通 |
绘制单位 | 中国科学院天津工业生物技术研究所、中国科学院微生物研究所、中国科学院天津工业生物技术研究所、中国科学院微生物研究所、中国科学院天津工业生物技术研究所 |
更多格式 | 高清、无水印(增值服务) |