《基于知识库的认知智能关键技术及其应用》

点击下载 ⇩

基于知识库的认知智能是人工智能技术体系的重要分支,是发展人工智能国家战略不可或缺的重要内容之一,是各行业智能化升级与转型特别是传统实体行业战略型转型的关键核心技术。然而,由于历史原因,知识工程技术存在历史断代,传统知识工程技术已经难以满足大数据时代的规模化应用需求,严重阻碍了各行业智能化转型的进程。项目历时10年,攻克了知识图谱等大规模知识库的高效管理、基于知识库的自然语言处理等难点技术;突破在认知智能技术客服行业的大规模产业化瓶颈;在典型行业落地应用取得了显著效果。主要创新点为:

1、构建十亿级别大规模知识库。该项目提出了一系列有效的分布式存储与在线查询方案,将知识管理从千万知识节点规模推进到十亿节点的新高度;提出了一系列轻量敏捷的知识获取索模型与高效求解算法,突破了知识获取实用化的诸多瓶颈。十亿节点规模的巨图存储与查询一直是限制知识图谱大规模应用的瓶颈所在。首次提出了基于多层次标签传播的图划分方法,在国际上较早实现了巨图的分布式存储;提出了基于图嵌入的最短路径查询系统,在国际上较早实现了十亿节点、百亿边的巨大规模知识图谱上的最短距离实时查询回答。社团是知识图谱中的一类重要子结构,申请人创新性地提出了轻量敏捷的社团搜索模型,提出了基于局部搜索的高效求解算法,突破了社团发现的应用瓶颈。

2、基于大规模知识库提升计算机的自然语言理解能力。该项目提出了一系列基于知识库的自然语言处理模型,显著提升了若干实际问题的应用效果;开辟了知识引导的问题求解思路,降低了统计学习模型对于大样本的依赖。传统自然语言理解以及互联网核心应用解决问题的主流思路是建立基于大样本的统计学习模型。然而这一思路在样本稀缺的实际应用场景下,特别是在系统冷启动阶段、在处理长尾对象时、在稀缺样本的领域、以及在资源贫瘠的语种下,表现出明显的局限性。申请人利用大规模知识图谱作为背景知识,降低模型对于大样本依赖,提升了模型对于先验知识的利用效率。申请人系统性地提出了一系列基于知识图谱的机器语言认知模型和推荐模型,开辟了知识引导与数据驱动相融合学术思路。

3、推动基于知识库的认知智能的产业化。该项目搭建了智能客服、知识问答等一系列软件、系统与平台,显著降低了用户成本。在基于人工智能的知识问答快速处理系统中,引入了用来存储大量知识型数据信息的知识库和用户数据信息的用户库,构建了意图判断引擎、智能分类引擎、相似问题搜索引擎以及答案总结引擎。实现了用户意图的精准理解、答案的精准检索以及自然人机交互。

上述成果先后发表相关论文12篇,授权3项相关专利和3项软件著作权。相关技术在多个行业的智能客服解决方案中得以大规模应用,取得了巨大的经济效益和社会效益。截止2017年,在项目的产业化中,累计投入的成本为4686.01万元,累计收入32533.26万元,累计纳税额为3855.45万元。

成果说明

该项目的成果已在多个领域中应用,并且在相关企业形成应用示范: 在金融领域中,招商银行信用卡中心有效整合了智能交互与自然语言处理以及知识库图谱等相关技术,建设互联网智能知识库,首次打造出一个知识库可同时服务于内外部两类客户群体的新服务生态,实现企业知识的互联网化、开放化、透明化、统一化,该系统是以智能语意理解模式替代传统的坐席记忆加关键字搜索的工作模式,为招商银行信用卡中心带来了极大的便利,减轻客服人员的工作压力,同时增强可服务用户的数量,大大的提升了效率。 在运营商领域中,中国移动通信集团广东有限公司

  1. 下载详细PDF版/Doc版

提示:为方便大家复制编辑,博主已将PDF文件制作为Word/Doc格式文件。