《表1 微博文本词频Top10》

《表1 微博文本词频Top10》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于文本挖掘的网络舆情主题发现与情感分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
数据来源:根据采集的微博文本数据统计整理而得。

使用正则表达式对文本内容数据进行清洗,删除重复的文本数据,删除@、数字、无用网址、表情等无关内容,提取文本内容,再将清洗后的数据进行分词处理,利用python中的JIEBA分词工具包,对文本内容逐条进行分词,去除停用词、标点符号等无意义的词。对处理好的数据进行高频词统计并绘制词云图,其结果如表1和图1所示。