《表3 实验结果Tab.3 Experimental results》

《表3 实验结果Tab.3 Experimental results》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《融合手工特征与双向LSTM结构的中文分词方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
%

研究中选择使用F1值作为评价指标,实验结果详见表3。根据实验结果,融合手工特征和双向LSTM结构的方法取得了最优的效果,且相比其余2种方法提升明显。LTP作为传统中文分词方法的代表,在开发集和测试集上均取得了不错的效果,但是其在测试集上的F1值相比在开发集上低0.13个百分点,高于Uni-Bi-LSTM的0.11和All-Bi-LSTM的0.07,这表明在此数据集上基于Bi-LSTM的方法泛化能力更强。仅使用unigram特征的Uni-BiLSTM方法效果最差,相比All-Bi-LSTM在开发集上低1.65个百分点,测试集上低1.69个百分点。这表明仅是通过双向LSTM结构去自动学习输入中的特征还是不够的,引入手工特征能够显著提升模型效果。最后,同样基于手工特征,使用Bi-LSTM结构的All-Bi-LSTM方法比使用结构化感知器的LTP效果优异,在开发集和测试集上分别高0.28和0.34个百分点,这说明Bi-LSTM结构的特征组合能力更加强大。