《表2 机器学习指导蛋白质设计应用》

《表2 机器学习指导蛋白质设计应用》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《蛋白质工程:从定向进化到计算设计》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

目前尚未有任何一种普适的学习算法,可以应对所有的学习任务,在蛋白质设计改造领域亦是如此。因此,科研工作者需要在相应的情况下,通过测试比对等方式选用合适的算法进行设计[84]。常见算法包括线性模型(Linear models)、随机森林(Random forests)、支持向量机(Support vector machines)、高斯过程(Gaussian processes)等。以Frances H.Arnold团队近期改造一氧化氮双加氧酶(NOD)立体选择性的工作为例,先后通过K最近邻、线性模型、决策树、随机森林等多个算法构建NOD的立体选择性催化模型,将76%(S)-ee初始突变体提升至93%(S)-ee及反转至79%(R)-ee[85]。此外,表2列举了近十几年来机器学习指导蛋白质设计的应用实例,涉及蛋白质的热稳定性、催化活性、对映体选择性、光敏性及可溶性等多个方面。从中不难看出,机器学习的可应用性非常强,各常用算法均可覆盖某些蛋白质性能的改造。