《表4 属性特征词:基于R语言的商品评论情感可视化分析》
文本处理中一个非常重要的环节是特征词提取,然后由IDF来算出每个词的权重,词语出现的频率越高则IDF值越大。得到\"词频\"(TF)和\"逆文档频率\"(IDF)以后,数值相乘即得到这个词的TF-IDF值。一个词对文章的重要性与该词的TF-IDF值大小成正比关系。最后只需要选取TF-IDF值排在最前面的几个词,即为文章的特征词。根据算法,将手机评论的特征词提取出来,大致分为6类(表4)。
图表编号 | XD00132357400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 陈俊宇、郑列 |
绘制单位 | 湖北工业大学理学院、湖北工业大学理学院 |
更多格式 | 高清、无水印(增值服务) |