《表1 基于迁移学习的模型效果对比》

《表1 基于迁移学习的模型效果对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向企业动态风险的知识图谱构建与应用研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

值得注意的是,企业领域语料标注较少,人民日报语料库属于新闻类标注语料库,直接使用会导致一些企业领域特征在新闻领域的局限下被忽略,本文通过迁移学习来优化上述深度学习模型。对于提取人名、地名、机构名的实体识别来说,企业和新闻领域的数据有极大的相似性,以新闻领域为源领域,企业领域为目标领域,首先使用人民日报语料库的新闻语料进行预训练,再基于百科网页爬取到的1 429条企业领域标注数据进行训练,将前者的SA-Bi LSTM-CRF模型的参数训练结果分别迁移到后者模型的Embedding层和CRF层上,形成4个参数各异的对比实验。从表1的实验结果来看,人民日报语料库与企业领域数据存在一定程度上的相似性,迁移学习能够有效提升SA-Bi LSTM-CRF模型的实体识别效果。