《表3 优化算法及原算法的话题测评性能分析》
以10000篇文本进行文本的聚类测试,分别从中选取1000篇文本来进行分词以及自编码神经网络训练。将所有的词汇频率进行计算后,选出词汇频率的前5000个形成特征池,将所有文本进行TF-IDF向量化后进行自便面神经网络训练,从而构成五层神经网络结构。这五层神经网络结构的节点数量分别是5000、2500、1200、2500、5000,并计算出eMES误差值,将其和阈值进行对比分析。当eMES值在0.001内,那么就进行100次循环操作,设定学习速率为0.01。当阈值T>0.2,就可以进行话题的拆分,将耽搁话题拆分个多个话题。若T<0.2,那么就可能会出现多个话题聚集,导致聚类精度低,产生较高误检率。为了验证此次优化算法的性能,将其和优化改进前的算法进行对比分析,并选取七个热点话题进行聚类分析,设定阈值T=0.03,对应得到性能测评的结果如表3所示。
图表编号 | XD00157763900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.20 |
作者 | 郑风玉 |
绘制单位 | 滨州市技术学院食品工程系 |
更多格式 | 高清、无水印(增值服务) |