《表1 需求属性词(主题分词)数据表(部分数据)》

《表1 需求属性词(主题分词)数据表(部分数据)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于大数据的用户画像构建方法与运用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

因此,将预处理过的有效评论作为文档,分词打标后获得文本词语N库作为条件,利用R语言编程分析得出近158个主题分词。由于机器处理获取的少数主题分词的词意可能无法成为有效的用户需求属性词,所以还需要对这近158个词进行再次筛选分析。我们邀请了5名相关专家,将这些主题分词结合相关评论文本句进行分词有效性评估,并算出对应的权重值。每个分词有效性评估的选项分为5个(等级):无效、有点效、有效、非常有效和极为有效,并分别赋值为1,2,3,4,5。专家们分别进行评估后会得出每个分词5个等级的评价比例,选择“有效”以及以上数据统计,以67%为界限,如果分词的“有效”、“非常有效”和“极为有效”的比例合计小于67%,则删除该分词视为无效(删除13个分词)。通过计算每个分词的权重,选取权重值前100的分词作为需求属性词,见表1。