《表3 多种日志模板提取算法对不同日志的处理时间》
在线上运行时日志是呈流的形式不断产生的,因此除了算法处理的准确率之外,算法的处理效率也十分重要,处理速度慢,会导致日志的堆积[13].本研究统计不同算法对相同数量的日志集进行处理所需的时间t,结果如表3所示.可以看出,IPLoM是离线算法,因此处理速度相较于在线算法会有所欠缺.在在线处理算法中,SHISO在处理速度上稍慢,因为SHISO算法计算单词的相似度,算法复杂度急剧增长.Spell算法基于最长公共子序列计算相似度,优化对部分模板的处理准确度,但是也增加了对日志的诸多重复处理.CLEA具有最好的表现,一方面是因为使用树状图将日志进行集群划分,使巨大的数据集可以被划分成小部分处理,另一方面是因为算法直接对单词进行对比,实时生成模板,减少不必要的重复计算.
图表编号 | XD00159305200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.01 |
作者 | 丛群 |
绘制单位 | 北京邮电大学网络技术研究院信息网络中心、北京网瑞达科技有限公司 |
更多格式 | 高清、无水印(增值服务) |