《表8 HCR数据集统计信息》

《表8 HCR数据集统计信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于社交关系增强的短文本情感分析方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文实验采用推特数据集HCR[5],该数据集包含了大量的一段时间发表的、关于医疗保健改革讨论的推特。HCR数据集中有5个类型的情感标签:正向积极(positive)、负向消极(negative)、中立(neutral)、无关(irrelevant)和不确定(unsure)。数据集还给推特定义了8个不同的情感目标类。另外HCR数据集分成3个子集:训练集、开发集和测试集。除了原始的文本内容和情感标签外,数据集中还提供了用户与用户间的社交网络关系。将上述3个子数据集合并成一个大的数据集进行实验,只保留正向积极(positive)和负向消极(negative)2个情感极性的数据,并对不同的情感目标类别不做区分,统计出HCR数据集的基本信息,如表8所示。