《表1 移民话题情感语料库构建》

《表1 移民话题情感语料库构建》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《大数据驱动的社交网络舆情用户情感主题分类模型构建研究——以“移民”主题为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文对文档进行分词,通过将文档中的文本归类为情感词和程度副词、否定词,以此判断情感词与程度副词或否定词结合产生的情感值[25]。如情感词与程度副词的乘积代表程度副词的程度值,情感词与程度副词的乘积乘以“-1”代表情感词前有否定词,最后,将一条语句的所有情感词的情感值得分加起来,大于0的归于正向,小于0的归于负向。本文选择BosonNLP情感词典构建社交媒体用户中文情感语料库。英文语料库的构建主要来自两个英文语料库词典,一个是MPQA词典(http://mpqa.cs.pitt.edu/),该词典的主观词语来自OpinionFinder系统,含有8221个主观词,并为每个词语标注了词性、词性还原以及情感极性;另一个是哈佛大学提出的General Inquirer情感词典(http://www.wjh.harvard.edu/~inquirer/homecat.htm),该词典收集了1914个褒义词和2293个贬义词,并为每个词语按照极性、强度等设置不同的标签。本文构建的“移民”话题情感语料库如表1所示。