《表3 两种分词对比表:融合信息熵与多权TF-IDF的营销评论关键词提取算法》

《表3 两种分词对比表:融合信息熵与多权TF-IDF的营销评论关键词提取算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《融合信息熵与多权TF-IDF的营销评论关键词提取算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

互联网营销活动的标题和评论包含新词,传统分词算法可能无法实现新词的提取。本实验利用互信息和左右熵,以Tire树为数据结构提取新词。互信息是一个词语中包含的关于另一个词语的信息量,即两个词共同出现的概率。左右熵衡量预选词的自由度。左右熵越大,说明该预选词越有可能是独立词语。通过传统分词算法和基于互信息和左右熵的分词算法的分词结果见表3。