《表1 系统文本聚类算法性能分析》
爬虫获得的舆情信息需要通过本文分析方法进行数据的处理,因此文本聚类算法的性能对于系统舆情信息处理的准确度有重要影响。为衡量文本聚类算法的性能,本文定义召回率和准确率两个指标。记T为聚类算法归类后正确的舆情信息数目,S为所有爬取的舆情信息总数,W为聚类算法产生的所有舆情信息的总数。则准确率P=T/W,召回率R=T/S。可看出,P和R是一对相互冲突的指标,为缓解冲突在算法性能的衡量过程中,本文使用F1法则,F1=2PR/(P+R)。实验结果,如表1所示。
图表编号 | XD00132248700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.20 |
作者 | 白蓉、王东新 |
绘制单位 | 西安航空职业技术学院、西安航空职业技术学院 |
更多格式 | 高清、无水印(增值服务) |