《表3 数据集的统计信息:面向短文本情感分析的多特征融合方法研究》

《表3 数据集的统计信息:面向短文本情感分析的多特征融合方法研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向短文本情感分析的多特征融合方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文采用英文和中文两种语言中公开评测的情感分析数据集:1)SemEval20173是SemEval在2017年语义评测比赛任务4中子任务A的数据集(英文),共有20632条数据,包含三种情感极性:neutral、negative、positive;2)NLPCC20144,5是NLPCC在2014年情感评测任务中的公开数据集(中文),来自新浪微博,每条微博都对应一个情感标签,共有8类标签,将情感标签none视为neural;happiness和like视为positive;其余五类视为negative,将8类标签分成3类:中性、积极、消极.删除其中为空的两条内容,最终有13998条数据.数据集中三个情感类别的统计信息如表3所示.