《表2 2种分词方法分词结果》

《表2 2种分词方法分词结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《水利水电行业专用中文分词方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

2)新方法捕捉分词正确率更高。原Jieba方法虽然可以通过学习认识新词语,但学习新的搭配词语的能力有限;新方法基于水利水电专业词典,在遇到水利水电专业中新搭配词语时,可以通过加权因子调整该搭配词语的权重,因此切分表现较好。表2列出了2种分词方法分词的9个例子,可以看出:原Jieba方法具有代表性的切分错误情况,而新方法解决了切分错误及颗粒过小的问题。