《表1 日志预处理:基于一致性预测算法的内网日志检测模型》

《表1 日志预处理:基于一致性预测算法的内网日志检测模型》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于一致性预测算法的内网日志检测模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

日志预处理包括日志解析、特征提取和数据清洗。如表1所示,日志解析将非结构化的原始文本日志解析为结构化日志。通过自动日志解析,将原始日志中变量部分用通配符替换为通配模板。特征提取将原始日志解析为结构化日志后对其用事件id的形式标记。每一个通配模版对应一个事件id,并记录每条结构化日志中出现的block_id。根据block_id将结构化日志分组形成日志序列,对日志序列中每个事件id出现的次数计数,形成特征向量。多个特征向量按照长方阵列排列得到特征向量矩阵,输入机器学习模型。