《表1 K-Means算法聚类结果》
网络舆情分析系统基于Hadoop开发,系统选择新闻、论坛及微博作为信息源,利用网络爬虫技术对2019年内的新闻报道和帖子爬取数据,再从这些信息中随机选取了翟天临事件、大学生网贷、乘客进驾驶舱、上海垃圾分类和凉山森林火灾等5个话题,为每个话题选择100篇相关的文本信息作为语料库,共500篇,使用Eclipse设计舆情分析算法,后台数据库采用My SQL,进行舆情分析实验。基于K-Means算法与改进的K-Means算法的话题检测统计结果如表1与表2所示。从实验结果来看,提出的网络舆情分析算法快速有效,话题检测准确率较高。
图表编号 | XD00200498900 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.15 |
作者 | 李丽蓉 |
绘制单位 | 山西警察学院 |
更多格式 | 高清、无水印(增值服务) |