《表1 问答情感分类语料集的类别分布》
数据设置:实验数据来自Shen等[6]公开的问答型评论语料(1),该语料包含美妆,鞋类和数码3个领域,具体类别分布如表1所示。在本实验中,我们将每个领域随机分为训练集(每个类别的70%样本)、验证集(每个类别的10%样本)以及测试集(每个类别的20%样本)。另外,本实验所使用的普通评论从淘宝(2)爬取,每条评论自带用户的打分(打分范围为1—5分)。我们将大于3分的认为是包含正面情感的评论,评分低于3分的认为是包含负面情感的评论。通过这种方式在美妆、鞋类和数码3个领域中,每个领域选择5 000条包含正面情感的评论以及5 000条包含负面负面情感的评论。
图表编号 | XD0091828200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.01 |
作者 | 安明慧、沈忱林、李寿山、李逸薇 |
绘制单位 | 苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、香港理工大学人文学院中文及双语系 |
更多格式 | 高清、无水印(增值服务) |