《表1 标注集说明:面向高校学生微博的跨粒度情感分析》
本文选用的语料是通过爬虫获取的山西农业大学学生的相关微博文本,总共10 000条。情感要素的抽取需要大量标注语料,人工标注的方式可靠却效率低下,因此采取文献[13]提出的基于MapReduce的协同训练(Tri-training)模型对语料进行半自动标注[13]。具体的标注状态分为四类:a) 正面情感(positive sentiment,PS)词,即识别出的词语若为正面情感词,简记为PS;b) 负面情感(negative sentiment,NS)词,即识别出的词语若为负面情感词,简记为NS;c) 复杂结构(complicated structure,CS)词,即识别出的词语若为复杂结构词,简记为CS;d) 背景(background word,BW)词,即识别出的词语若为背景词,简记为BW。其详细说明如表1所示。
图表编号 | XD0090282700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 刘丽、岳亚伟 |
绘制单位 | 山西农业大学软件学院、山西农业大学软件学院 |
更多格式 | 高清、无水印(增值服务) |