《表4 属性特征词:基于R语言的商品评论情感可视化分析》

《表4 属性特征词:基于R语言的商品评论情感可视化分析》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于R语言的商品评论情感可视化分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

文本处理中一个非常重要的环节是特征词提取,然后由IDF来算出每个词的权重,词语出现的频率越高则IDF值越大。得到\"词频\"(TF)和\"逆文档频率\"(IDF)以后,数值相乘即得到这个词的TF-IDF值。一个词对文章的重要性与该词的TF-IDF值大小成正比关系。最后只需要选取TF-IDF值排在最前面的几个词,即为文章的特征词。根据算法,将手机评论的特征词提取出来,大致分为6类(表4)。