《表1 特征列表:一种基于评论分析双层图的推荐方法》
首先我们对评论文件进行词性标注并删除停用词,停用词通常是冠词、介词、连词,它们经常出现在文本中但却没有实际含义.这些停用词会对特征提取造成干扰.由于产品的特征绝大多数是名词或名词短语并且出现得较为频繁,因此本文提取评论中的频繁名词项作为候选特征.但是并不是所有频繁名词项都是真正的特征.为了删除这种非特征的频繁名词项,本文创建包含少量特征的特征列表并与word2vec配合使用.例如对于餐厅,本文可以如表1所示的列表.
图表编号 | XD0079866700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 陈晋音、陈一贤、林翔、吴洋洋 |
绘制单位 | 浙江工业大学信息学院、浙江工业大学信息学院、浙江工业大学信息学院、浙江工业大学信息学院 |
更多格式 | 高清、无水印(增值服务) |