《表1 紧凑型SUV汽车用户评论数据统计信息》

《表1 紧凑型SUV汽车用户评论数据统计信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于XGBoost算法的用户评分预测模型及应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

选取紧凑型SUV里评论热度较高的汽车品牌,这些品牌价格适中且购买量较大。首先抓取用户评论、评分及车型、价格等信息。从抓取到的数据中筛选出裸车价格在15万到25万之间的汽车用户评论数据删除内容较少的评论。然后进行分词、去停用词、去标点符号等文本数据预处理操作。另外,在评论量化后的数据中,出现了少量在某些维度上为0的主题特征向量,这部分数据较少,对其进行了剔除处理。最终有效实验数据统计信息如表1所示,共计13 628条。表1的第2-11列为评论数最多的10种车型,共有5 702条评论(约42%)。第12列为其他车型的7 926条评论(约58%)。评分为1的用户占比约为47%,评分为0的用户占比约为53%。