《表1 移民话题情感语料库构建》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《大数据驱动的社交网络舆情用户情感主题分类模型构建研究——以“移民”主题为例》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

本文对文档进行分词，通过将文档中的文本归类为情感词和程度副词、否定词，以此判断情感词与程度副词或否定词结合产生的情感值[25]。如情感词与程度副词的乘积代表程度副词的程度值，情感词与程度副词的乘积乘以“-1”代表情感词前有否定词，最后，将一条语句的所有情感词的情感值得分加起来，大于0的归于正向，小于0的归于负向。本文选择BosonNLP情感词典构建社交媒体用户中文情感语料库。英文语料库的构建主要来自两个英文语料库词典，一个是MPQA词典（http：//mpqa.cs.pitt.edu/），该词典的主观词语来自OpinionFinder系统，含有8221个主观词，并为每个词语标注了词性、词性还原以及情感极性；另一个是哈佛大学提出的General Inquirer情感词典（http：//www.wjh.harvard.edu/～inquirer/homecat.htm），该词典收集了1914个褒义词和2293个贬义词，并为每个词语按照极性、强度等设置不同的标签。本文构建的“移民”话题情感语料库如表1所示。

图表编号	XD00175577500 严禁用于非法目的
绘制时间	2020.01.26
作者	王晰巍、邢云菲、韦雅楠、王铎
绘制单位	吉林大学管理学院、吉林大学大数据管理研究中心、吉林大学管理学院、吉林大学管理学院、吉林大学管理学院
更多格式	高清、无水印（增值服务）