《表1 语料统计:基于表情符注意力机制的微博情感分析模型》

《表1 语料统计:基于表情符注意力机制的微博情感分析模型》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于表情符注意力机制的微博情感分析模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了训练和测试语料,从新浪微博抽取了2017年4月份包含有表情符的10万条微博,使用jieba中文分词器进行分词,替换掉微博中的网址、用户及话题标签等。过滤掉长度小于5的微博文本。然后随机抽取其中的1万多条微博文本作为待标注微博,同时要求每个表情符出现的次数大于10次,去除重复以及表情符过少的微博后得到6 905条语料。在标注微博时,其情感标签分为正性、中性和负性三类。语料及标注统计如表1所示。