《表1 需求属性词(主题分词)数据表(部分数据)》
因此,将预处理过的有效评论作为文档,分词打标后获得文本词语N库作为条件,利用R语言编程分析得出近158个主题分词。由于机器处理获取的少数主题分词的词意可能无法成为有效的用户需求属性词,所以还需要对这近158个词进行再次筛选分析。我们邀请了5名相关专家,将这些主题分词结合相关评论文本句进行分词有效性评估,并算出对应的权重值。每个分词有效性评估的选项分为5个(等级):无效、有点效、有效、非常有效和极为有效,并分别赋值为1,2,3,4,5。专家们分别进行评估后会得出每个分词5个等级的评价比例,选择“有效”以及以上数据统计,以67%为界限,如果分词的“有效”、“非常有效”和“极为有效”的比例合计小于67%,则删除该分词视为无效(删除13个分词)。通过计算每个分词的权重,选取权重值前100的分词作为需求属性词,见表1。
图表编号 | XD00101780900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.20 |
作者 | 谭浩、郭雅婷 |
绘制单位 | 湖南大学、汽车车身先进设计制造国家重点实验室、湖南大学 |
更多格式 | 高清、无水印(增值服务) |