《表2 2种分词方法分词结果》
2)新方法捕捉分词正确率更高。原Jieba方法虽然可以通过学习认识新词语,但学习新的搭配词语的能力有限;新方法基于水利水电专业词典,在遇到水利水电专业中新搭配词语时,可以通过加权因子调整该搭配词语的权重,因此切分表现较好。表2列出了2种分词方法分词的9个例子,可以看出:原Jieba方法具有代表性的切分错误情况,而新方法解决了切分错误及颗粒过小的问题。
图表编号 | XD00208939100 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.25 |
作者 | 唐颖复、江新兰、张伟兵、王志璋、缪纶 |
绘制单位 | 中国水利水电科学研究院、中国水利水电科学研究院、中国水利水电科学研究院、中国水利水电科学研究院、中国水利水电科学研究院 |
更多格式 | 高清、无水印(增值服务) |