《表3 实验数据概况:基于自动提取句法模板的情感分析》
实验数据为第三届自然语言处理与中文计算会议(NLPCC 2014)任务2情感分析部分评测数据(1)。原数据集由22 431条标记好情绪类别的微博评论组成。将happiness、like、surprise情绪归为积极,将sadness、fear、disgust、anger归为消极。删除其中借用表情而非文本表达情感的语句3 536条,保留3 088条积极情感语句、2 639条消极情感语句和13 168条客观语句,用于模板的自动提取与验证。按照6∶2∶2的比例随机筛选各部分语句组成训练集、验证集和测试集,概况如表3所示。
图表编号 | XD0091821800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 潘浩、卫宇杰、潘尔顺 |
绘制单位 | 上海交通大学机械与动力工程学院、上海交通大学机械与动力工程学院、上海交通大学中国质量发展研究院、上海交通大学机械与动力工程学院、上海交通大学中国质量发展研究院 |
更多格式 | 高清、无水印(增值服务) |