《表2 MOOC评论文本统计信息》

《表2 MOOC评论文本统计信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《教育领域反馈文本情感分析方法及应用研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

数据集中的每一个评论会有一个用户给出的1~5分的打分,其中5分样本占据了总评论数据的84%,3分及以下评分样本的数量仅占据总评论数据的3.8%。为了避免这种不平衡数据导致的模型偏见,从完整数据集构建相对平衡的子集用于模型的构建与训练,具体方法如下:从用户打分为5分的样本中提取了15 000条评论作为正样本(积极情感)数据,并对用户打分为1~3分的6 731条评论进行人工标注,最终筛选出负样本(消极情感)评论4 148条,与正样本中的15 000条数据共同构成实验数据集(见表2)。