《表2 常见开源分词库对比》

《表2 常见开源分词库对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Python的微博用户分析系统设计与实现》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对文本的处理属于自然语言处理方向,一般可以采用机器学习技术对文本进行分类聚类,而在处理之前,分词是第一步,目前主流的分词方法是基于统计的分词算法,如n-gram,HMM,CRF等。NLP领域有大量的开源分词库可以用于研究和应用,常见的如表2所示。