《表3 不同分词结果对比:基于深度学习和迁移学习的领域自适应中文分词》
通过实验对比分析本文模型中超参数的影响,最终专业领域上的超参数设置如下:学习率lr为10-3,正则项系数α为0.001,Dropout丢弃率为50%。在建设工程法律领域文本中选取300个句子组成测试集,对比本文提出的模型与其他分词模型在测试集上的性能。表3列出了本文模型(KL散度系数为0,训练时带领域词典)、NLPIR分词方法(1)、BI-LSTM-CRF模型[7]、预测时带领域词典的BI-LSTM-CRF模型[7]、本文模型(KL散度系数为0,不带领域词典)、本文模型(KL散度系数为0.2,不带领域词典)在测试集上的准确率P、召回率R和综合指标F1。其中,BI-LSTM-CRF模型是直接使用文献[7]中,在通用领域语料上训练好的模型。对比分析表3中的分词结果,可以得到如下结论。
图表编号 | XD0091814200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 成于思、施云涛 |
绘制单位 | 东南大学土木工程学院、中国移动通信集团南京分公司网络部 |
更多格式 | 高清、无水印(增值服务) |