《表1 基于迁移学习的模型效果对比》
值得注意的是,企业领域语料标注较少,人民日报语料库属于新闻类标注语料库,直接使用会导致一些企业领域特征在新闻领域的局限下被忽略,本文通过迁移学习来优化上述深度学习模型。对于提取人名、地名、机构名的实体识别来说,企业和新闻领域的数据有极大的相似性,以新闻领域为源领域,企业领域为目标领域,首先使用人民日报语料库的新闻语料进行预训练,再基于百科网页爬取到的1 429条企业领域标注数据进行训练,将前者的SA-Bi LSTM-CRF模型的参数训练结果分别迁移到后者模型的Embedding层和CRF层上,形成4个参数各异的对比实验。从表1的实验结果来看,人民日报语料库与企业领域数据存在一定程度上的相似性,迁移学习能够有效提升SA-Bi LSTM-CRF模型的实体识别效果。
图表编号 | XD00212828700 严禁用于非法目的 |
---|---|
绘制时间 | 2021.03.01 |
作者 | 杨波、廖怡茗 |
绘制单位 | 江西财经大学信息管理学院、江西财经大学信息管理学院 |
更多格式 | 高清、无水印(增值服务) |