《表1 系统文本聚类算法性能分析》

《表1 系统文本聚类算法性能分析》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于JavaEE的网络舆情监控系统设计》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

爬虫获得的舆情信息需要通过本文分析方法进行数据的处理,因此文本聚类算法的性能对于系统舆情信息处理的准确度有重要影响。为衡量文本聚类算法的性能,本文定义召回率和准确率两个指标。记T为聚类算法归类后正确的舆情信息数目,S为所有爬取的舆情信息总数,W为聚类算法产生的所有舆情信息的总数。则准确率P=T/W,召回率R=T/S。可看出,P和R是一对相互冲突的指标,为缓解冲突在算法性能的衡量过程中,本文使用F1法则,F1=2PR/(P+R)。实验结果,如表1所示。