《表3 不同分词结果对比：基于深度学习和迁移学习的领域自适应中文分词》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于深度学习和迁移学习的领域自适应中文分词》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

通过实验对比分析本文模型中超参数的影响，最终专业领域上的超参数设置如下:学习率lr为10-3，正则项系数α为0.001，Dropout丢弃率为50%。在建设工程法律领域文本中选取300个句子组成测试集，对比本文提出的模型与其他分词模型在测试集上的性能。表3列出了本文模型（KL散度系数为0，训练时带领域词典）、NLPIR分词方法（1）、BI-LSTM-CRF模型[7]、预测时带领域词典的BI-LSTM-CRF模型[7]、本文模型（KL散度系数为0，不带领域词典）、本文模型（KL散度系数为0.2，不带领域词典）在测试集上的准确率P、召回率R和综合指标F1。其中，BI-LSTM-CRF模型是直接使用文献[7]中，在通用领域语料上训练好的模型。对比分析表3中的分词结果，可以得到如下结论。

图表编号	XD0091814200 严禁用于非法目的
绘制时间	2019.09.01
作者	成于思、施云涛
绘制单位	东南大学土木工程学院、中国移动通信集团南京分公司网络部
更多格式	高清、无水印（增值服务）