《表1 酶元件资源数据库及链接》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于合成生物学策略的酶蛋白元件规模化挖掘》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

各种类型的蛋白质资源数据库为酶元件的高通量挖掘提供了宝贵的材料，如表1所示。截至2020年2月，蛋白质资源数据库Uni Prot中储存了约18亿条蛋白质序列。其中大部分功能注释是通过与CDD （conserved domain database）[20]，Pfam[21]，CATH[22]和FIGfams[23]等数据库中蛋白的结构域序列进行同源性比对而获得[19]；但至少50%的注释并不精确甚至是错误的[24]。因此，需要整合不同层次的功能注释工具和实验数据，帮助科研人员从序列、结构、进化和蛋白互作等多个层面对候选酶元件进行综合分析。其中，酶蛋白聚类分析可以利用可视化手段最大程度地利用文献中实验数据对未知蛋白质进行多个维度的功能注释[25]。下面将重点介绍用于酶蛋白聚类分析的两个方法：序列相似性网络分析工具（sequence similarity network，SSN)[26]，以及侧重蛋白质结构比对的CATH分析工具（Class，Architecture，Topology，Homologous superfamily)[22]。

图表编号	XD00193213000 严禁用于非法目的
绘制时间	2020.06.01
作者	张建志、付立豪、唐婷、张嵩亚、朱静、李拓、王子宁、司同
绘制单位	中国科学院深圳先进技术研究院深圳合成生物学创新研究院中国科学院定量工程生物学重点实验室、中国科学院深圳先进技术研究院深圳合成生物学创新研究院中国科学院定量工程生物学重点实验室、中国科学院深圳先进技术研究院深圳合成生物学创新研究院中国科学院定量工程生物学重点实验室、中国科学院深圳先进技术研究院深圳合成生物学创新研究院中国科学院定量工程生物学重点实验室、中国科学院深圳先进技术研究院深圳合成生物学创新研究院中国科学院定量工程生物学重点实验室、中国科学院深圳先进技术研究院深圳合成生物学创新研究院中国科学院定量工程
更多格式	高清、无水印（增值服务）