《表5 语料信息:基于词典的文本极性计算及分类研究》

《表5 语料信息:基于词典的文本极性计算及分类研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于词典的文本极性计算及分类研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本次实验使用的语料数据是利用爬虫技术爬取某大型电商平台上关于“999感冒药”销售的评论数据,去除不规范文本,最终选出2550条评论数据。手工对所有数据进行情感倾向性标注,然后把所有语料分为两部分,其中2100条评论作为训练语料,其余的450条作为测试语料,语料基本信息如表5所示。图4为语料的句子长度分布,图5以词云的形式展示了语料的一些关键信息。