《表3 优化算法及原算法的话题测评性能分析》

《表3 优化算法及原算法的话题测评性能分析》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于智能算法的食品安全网络舆情监测方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

以10000篇文本进行文本的聚类测试,分别从中选取1000篇文本来进行分词以及自编码神经网络训练。将所有的词汇频率进行计算后,选出词汇频率的前5000个形成特征池,将所有文本进行TF-IDF向量化后进行自便面神经网络训练,从而构成五层神经网络结构。这五层神经网络结构的节点数量分别是5000、2500、1200、2500、5000,并计算出eMES误差值,将其和阈值进行对比分析。当eMES值在0.001内,那么就进行100次循环操作,设定学习速率为0.01。当阈值T>0.2,就可以进行话题的拆分,将耽搁话题拆分个多个话题。若T<0.2,那么就可能会出现多个话题聚集,导致聚类精度低,产生较高误检率。为了验证此次优化算法的性能,将其和优化改进前的算法进行对比分析,并选取七个热点话题进行聚类分析,设定阈值T=0.03,对应得到性能测评的结果如表3所示。