《表4 文本情感标注数据示例》

《表4 文本情感标注数据示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于深度学习的文本情感分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

以微博平台为研究对象,通过网络爬虫的方式爬取新浪微博10万多条数据.根据微博文本内容的规则,其中含有“//@”一般为转发微博,首先根据正则表达式进行文本匹配,若文本中含有“//@”,则通过程序删除此文本.将删除之后的文本放在excel中进行筛选,对于重复的文本内容进行最后删除.将经过预处理之后的文本中包含的表情符号替换成对应文本文字,使用0和1对此微博语料进行人工标注,正面情感标注为1,负面情感标注为0,具体的标注规则如表3所示,由3个人进行标注审核保证语料集的可信性,最终得到含有正负面情感的微博文本数据各2万条.标注完成之后的数据格式如表4所示.