《表3 数据集的统计信息:面向短文本情感分析的多特征融合方法研究》
本文采用英文和中文两种语言中公开评测的情感分析数据集:1)SemEval20173是SemEval在2017年语义评测比赛任务4中子任务A的数据集(英文),共有20632条数据,包含三种情感极性:neutral、negative、positive;2)NLPCC20144,5是NLPCC在2014年情感评测任务中的公开数据集(中文),来自新浪微博,每条微博都对应一个情感标签,共有8类标签,将情感标签none视为neural;happiness和like视为positive;其余五类视为negative,将8类标签分成3类:中性、积极、消极.删除其中为空的两条内容,最终有13998条数据.数据集中三个情感类别的统计信息如表3所示.
图表编号 | XD00175962400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.01 |
作者 | 陶永才、张鑫倩、石磊、卫琳 |
绘制单位 | 郑州大学信息工程学院、郑州大学信息工程学院、郑州大学信息工程学院、郑州大学软件技术学院 |
更多格式 | 高清、无水印(增值服务) |