《表5 基于日志数据的故障根因诊断方法分析》
基于关联推断的方法可以充分利用日志之间的上下文关联关系,恢复请求执行逻辑,可以细粒度地定位不同类型的系统故障,并且可以定位与故障敏感的请求执行路径,故障诊断效率较高,模型易于理解,能够有效地为运维人员修复故障提供支持;缺点在于仅适用于事务型日志序列,无法检测操作型日志中的异常表征,对日志序列进行建模难以精确刻画系统多线程和并发的复杂情形,可能需要大量的系统知识辅助离线建模过程,构建故障根因诊断模型可能需要日志文本中包含一些关联信息,如请求ID、线程ID等,具有一定的适用范围限制;基于机器学习的方法可以方便输出与故障敏感的日志集合或输出故障类型,对日志的内容和系统知识的假设较少,能够有效地从不同的日志类型中提取较为全面的特征并构建模型,适用事务型日志和操作型日志;缺点在于十分依赖日志特征的选取和处理,需要离线训练阶段以及大量带标签的训练数据,故障定位粒度较粗,辅助故障诊断的能力弱于基于关联推断的方法.同时,机器学习模型和深度学习模型往往难以理解,对运维人员修复故障的辅助能力不足.
图表编号 | XD00168937500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.01 |
作者 | 贾统、李影、吴中海 |
绘制单位 | 北京大学信息科学技术学院、北京大学软件工程国家工程研究中心、北京大学软件工程国家工程研究中心 |
更多格式 | 高清、无水印(增值服务) |