《表3 产品特征词分类表(部分)》
针对汽车评论数据集,根据句法规则对其进行标注,按照标注结果选取评论中的动词和名词作为备选产品特征指标词,选取词频统计排名前100的词为产品特征指标词。由于存在非领域特征词,需要人工对其进行筛选,将筛选后的词语进行分类,对同义词进行合并,作为产品特征种子词;将分词后的评论文本作为Word2vec的输入语料,借助Gensim库的Word2vec函数训练生成词向量文件,利用相似度函数,计算种子词语的相似特征词。产品指标词的词向量结果如表1所示。以指标词“造型”为例,相似度排名前30的词语如表2所示。按照上述方法,扩充种子词汇,形成最终产品特征词集,如表3所示。
图表编号 | XD00211139600 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.01 |
作者 | 谷莹、李贺、李叶叶、刘嘉宇 |
绘制单位 | 吉林大学管理学院、吉林大学管理学院、吉林大学管理学院、吉林大学管理学院 |
更多格式 | 高清、无水印(增值服务) |