《表1 标注数据:融入表情特征的网络舆情情感分析方法研究》

《表1 标注数据:融入表情特征的网络舆情情感分析方法研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《融入表情特征的网络舆情情感分析方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

预处理分为3个步骤:首先,数据清洗环节包括删除非原创博文和博文噪声。博文噪声,是指网址链接、标签、特殊符号(“$”“#”“@”……)等;其次,使用Jieba分词脚本对博文进行分词;最后,去停用词。采用人工标注的方法,对微博数据进行标注。标注工作由课题组医学信息学专业的3名硕士研究生完成,3位成员共同标注8 000条语料,标注结果,见表1。