《表1 不同分词模型在PKU, MSRA, CTB 6.0数据集的分词效果》

《表1 不同分词模型在PKU, MSRA, CTB 6.0数据集的分词效果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于BI_LSTM_CRF神经网络的序列标注中文分词方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文实现了BI_LSTM_CRF神经网络中文分词算法。记4词位标注得到模型为BI_LSTM_CRF(4-tag),6词位标注得到的模型记为BI_LSTM_CRF(6-tag)。表1比较了不同中文分词模型的分词效果,由测试结果可以看出,基于BI_LSTM_CRF神经网络中文分词模型在3个数据集上的测试6词位标注优于4词位标注,且表现性能略好于其他分词模型。选用BI_LSTM_CRF(6-tag)模型在新闻数据、微博数据、汽车论坛数据、餐饮点评数据等不同领域进行测试,数据集信息如表2所示,中文分词测试结果如表3所示。