《表1 微博文本词频Top10》
数据来源:根据采集的微博文本数据统计整理而得。
使用正则表达式对文本内容数据进行清洗,删除重复的文本数据,删除@、数字、无用网址、表情等无关内容,提取文本内容,再将清洗后的数据进行分词处理,利用python中的JIEBA分词工具包,对文本内容逐条进行分词,去除停用词、标点符号等无意义的词。对处理好的数据进行高频词统计并绘制词云图,其结果如表1和图1所示。
图表编号 | XD00198680600 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.28 |
作者 | 邱泽国、贺百艳 |
绘制单位 | 哈尔滨商业大学、哈尔滨商业大学 |
更多格式 | 高清、无水印(增值服务) |