《蛋白质亚细胞定位计算预测关键技术及应用》

点击下载 ⇩

1、主要技术内容:

预测蛋白质的亚细胞位置,对了解蛋白质的结构和功能,辅助基础研究和生物制药具有重要意义。该项目旨在为计算预测蛋白质亚细胞位置提供技术支持,主要技术内容如下:

(1)提出一种基于随机类标选择的多标记机器学习新算法,该算法利用集成学习技术,把多个部分类标间关系的预测效果融合起来,取得既高效利用类标间关系又避免繁琐调参的效果。该算法应用到真核、人类蛋白质亚细胞多位置预测中,均显著提高了预测精度。

(2)提出一种基于类标相关特征的多标记机器学习新算法,并成功应用到凋亡蛋白质亚细胞多位置预测中,是该领域唯一的多位置预测方法。该算法采用皮尔逊相关系数方法提取与类标最相关的特征,然后利用最相关特征分别为每个类标构建预测模型。

(3)提出一种结合类标间关系和类标相关特征的多标记机器学习新算法,该算法应用在蛋白质亚叶绿体多位置预测中,取得当时最好预测结果,受到国际知名专家的高度评价。

(4)提出一种最优多标记集成机器学习新算法,并在细菌蛋白质亚细胞多位置预测中成功应用,显著提高预测精度。该算法扩展bagging方法,集成多个多标记分类器,并采用免疫优化算法选取最优多标记分类器子集组建最终预测模型。

(5)提出一种受生物组合启发的重组算子和一种改进的超变异算子,整合两种算子进而提出一种克隆选择优化新算法,并成功应用到技术内容(3)和(4)所提算法中,取得优异的优化选取效果。

2、授权专利情况:

该项目授权专利1项,软件著作权4项,发表学术论文8篇(2篇中科院JCR 1区,3篇中科院JCR 2区,3篇中科院JCR 4区)。

3、技术经济指标:

该项目充分利用类标间相互关系,类标相关特征对多标记机器学习算法预测性能的影响,设计开发若干新颖的多标记机器学习算法,并进一步提出最优的多标记算法的集成方法,并成功应用到蛋白质亚细胞多位置预测领域中,大幅度提高亚细胞多位置预测的精度。该项目使产品设计周期缩短近25%,系统成本降低30%左右,预测性能提高20%以上,预测效率提高30%以上。

4、应用推广及效益情况:

该项目关键技术完成后,先后在河南青果网络技术有限公司、郑州智硕电子科技有限公司、深圳市合晶科技有限公司等单位进行测试和试用,三年来共实现直接经济效率10341万元。随着继续推广应用,将产生更大的经济社会效率。

成果说明

该项目关键技术和智能预测系统经过多次的需求分析、研制、仿真优化、测试及调试,系统功能运行正常。本项目以蛋白质亚细胞位置预测为背景,研发高精度,高效率的机器学习新技术,这些新技术既可以应用到蛋白质亚细胞位置预测领域中,又可以应用到其他智能分析和预测产品中。目前本项目关键技术已经在河南青果网络技术有限公司,郑州智硕电子科技有限公司和深圳市合晶科技有限公司进行测试和集成应用,应用范围涵盖蛋白质亚细胞位置预测,蛋白质二级结构预测,抗微生物肽功能类型预测等不同领域,取得了良好的经济和社会效益。企业使用以来,反映良好

  1. 下载详细PDF版/Doc版

提示:为方便大家复制编辑,博主已将PDF文件制作为Word/Doc格式文件。