《表3 多种日志模板提取算法对不同日志的处理时间》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《复合型日志的模板提取方法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在线上运行时日志是呈流的形式不断产生的，因此除了算法处理的准确率之外，算法的处理效率也十分重要，处理速度慢，会导致日志的堆积[13].本研究统计不同算法对相同数量的日志集进行处理所需的时间t，结果如表3所示.可以看出，IPLoM是离线算法，因此处理速度相较于在线算法会有所欠缺.在在线处理算法中，SHISO在处理速度上稍慢，因为SHISO算法计算单词的相似度，算法复杂度急剧增长.Spell算法基于最长公共子序列计算相似度，优化对部分模板的处理准确度，但是也增加了对日志的诸多重复处理.CLEA具有最好的表现，一方面是因为使用树状图将日志进行集群划分，使巨大的数据集可以被划分成小部分处理，另一方面是因为算法直接对单词进行对比，实时生成模板，减少不必要的重复计算.

图表编号	XD00159305200 严禁用于非法目的
绘制时间	2020.08.01
作者	丛群
绘制单位	北京邮电大学网络技术研究院信息网络中心、北京网瑞达科技有限公司
更多格式	高清、无水印（增值服务）