《表8 HCR数据集统计信息》
本文实验采用推特数据集HCR[5],该数据集包含了大量的一段时间发表的、关于医疗保健改革讨论的推特。HCR数据集中有5个类型的情感标签:正向积极(positive)、负向消极(negative)、中立(neutral)、无关(irrelevant)和不确定(unsure)。数据集还给推特定义了8个不同的情感目标类。另外HCR数据集分成3个子集:训练集、开发集和测试集。除了原始的文本内容和情感标签外,数据集中还提供了用户与用户间的社交网络关系。将上述3个子数据集合并成一个大的数据集进行实验,只保留正向积极(positive)和负向消极(negative)2个情感极性的数据,并对不同的情感目标类别不做区分,统计出HCR数据集的基本信息,如表8所示。
图表编号 | XD00156652300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.15 |
作者 | 刘树栋、王磊、武璟珑、徐亮 |
绘制单位 | 中南财经政法大学人工智能法商应用研究中心、中南财经政法大学信息与安全工程学院、中南财经政法大学人工智能法商应用研究中心、中南财经政法大学信息与安全工程学院、中国电子信息产业集团有限公司信息中心、京东商业提升事业部 |
更多格式 | 高清、无水印(增值服务) |