《表2 逻辑回归与朴素贝叶斯对比实验结果》

《表2 逻辑回归与朴素贝叶斯对比实验结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于用户心理的网络舆情指标体系构建研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为从整体角度考察指标体系热度预测效果,将18个舆情事件作为训练集,其中15个为热点事件,3个为非热点事件。舆情事件的标签由人工进行标注。模型的输出结果是该舆情为热点事件的概率,范围为0~1,通过预测的概率可以判断预测的标签。这里选择8个舆情事件进行热度预测,其中3个事件来自央视新闻,两个事件来自新浪新闻,其余3个事件分别来自封面新闻、江苏网络电视台和新华视点。逻辑回归的实验结果如表2第一行所示。表格中的概率为模型输出值,即模型预测该事件为热点事件的概率,括号内的数字为事件的真实标签:1为热点事件,0为非热点事件。同时,将逻辑回归模型与朴素贝叶斯模型进行对比,朴素贝叶斯实验结果如表2第二行所示。表2中,LR预测为逻辑回归的输出值,NB预测为朴素贝叶斯的输出值。对于8个事件,逻辑回归均预测正确,而朴素贝叶斯在事件5和事件8的预测中出现了错误。由以上实验可见,逻辑回归模型具有较高的准确性,且模型性能稳定。通过特征数据,可以发现有些特征具有较大的区分度,即可以明显区分出舆情的类别,例如评论数目等。相反,还有一些特征对于舆情是否为热点事件这一分类问题具有相对较少的贡献度,如舆情本身的情感倾向等。这一发现将为后续研究带来帮助,也就是说,可以通过调整指标体系末级指标在模型中的权重来侧重舆情研究的不同方面。例如,研究负面舆情的传播及干预问题,就需要着重考虑舆情情感倾向指标,对其赋予更高的权重。