《表3 不同分词结果对比:基于深度学习和迁移学习的领域自适应中文分词》

《表3 不同分词结果对比:基于深度学习和迁移学习的领域自适应中文分词》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于深度学习和迁移学习的领域自适应中文分词》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

通过实验对比分析本文模型中超参数的影响,最终专业领域上的超参数设置如下:学习率lr为10-3,正则项系数α为0.001,Dropout丢弃率为50%。在建设工程法律领域文本中选取300个句子组成测试集,对比本文提出的模型与其他分词模型在测试集上的性能。表3列出了本文模型(KL散度系数为0,训练时带领域词典)、NLPIR分词方法(1)、BI-LSTM-CRF模型[7]、预测时带领域词典的BI-LSTM-CRF模型[7]、本文模型(KL散度系数为0,不带领域词典)、本文模型(KL散度系数为0.2,不带领域词典)在测试集上的准确率P、召回率R和综合指标F1。其中,BI-LSTM-CRF模型是直接使用文献[7]中,在通用领域语料上训练好的模型。对比分析表3中的分词结果,可以得到如下结论。