《表1 标注集说明:面向高校学生微博的跨粒度情感分析》

《表1 标注集说明:面向高校学生微博的跨粒度情感分析》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向高校学生微博的跨粒度情感分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文选用的语料是通过爬虫获取的山西农业大学学生的相关微博文本,总共10 000条。情感要素的抽取需要大量标注语料,人工标注的方式可靠却效率低下,因此采取文献[13]提出的基于MapReduce的协同训练(Tri-training)模型对语料进行半自动标注[13]。具体的标注状态分为四类:a) 正面情感(positive sentiment,PS)词,即识别出的词语若为正面情感词,简记为PS;b) 负面情感(negative sentiment,NS)词,即识别出的词语若为负面情感词,简记为NS;c) 复杂结构(complicated structure,CS)词,即识别出的词语若为复杂结构词,简记为CS;d) 背景(background word,BW)词,即识别出的词语若为背景词,简记为BW。其详细说明如表1所示。