《表2 3种jieba分词模式》

《表2 3种jieba分词模式》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《人工智能背景下网络舆情数据识别及管理研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在文本处理中,单词是有意义的语言组成中最小的且能够独立活动的成分。中文不同与英语等拉丁化文字,词与词之间通过空格来隔开,天然的就能形成独立的单元。中文是靠逗号、句号等分界符对句、段等界限进行分隔。但在词语的分隔上,没有形成一种类似于空格对于英文的形而上的分割符。为了将中文语句形成独立的单元,使得计算机能够获取到文本的特征,就必须将中文进行分词。python中第三方库jieba中文分词库支持三种分词模式,如表2所示。