《表2 规范评论语料库示例》

《表2 规范评论语料库示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《微信社交网络顾客感知服务质量评价指标体系研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

利用Jieba系统和哈工大停用词表等对评论预处理。经过去短评、分词、词性标注和去停用词后,统计不同词性的词语比例,发现不论是在词汇表中还是在词语总数中,名词、动词和形容词占比均为90%左右,如图5和图6所示。这说明语料库中仅保留名词、动词和形容词,在充分保存语义信息的同时,也并没有损失过多数据。再接着去除单字和字数多于4个的词语,以及频数低于3的的低频词。最后得到的规范评论语料库包含6300条评论,词汇表长度为70089,语料词语总数为2650,规范评论语料库的评论示例如表2所示。