《表1 日志预处理:基于一致性预测算法的内网日志检测模型》
日志预处理包括日志解析、特征提取和数据清洗。如表1所示,日志解析将非结构化的原始文本日志解析为结构化日志。通过自动日志解析,将原始日志中变量部分用通配符替换为通配模板。特征提取将原始日志解析为结构化日志后对其用事件id的形式标记。每一个通配模版对应一个事件id,并记录每条结构化日志中出现的block_id。根据block_id将结构化日志分组形成日志序列,对日志序列中每个事件id出现的次数计数,形成特征向量。多个特征向量按照长方阵列排列得到特征向量矩阵,输入机器学习模型。
图表编号 | XD00140344400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.10 |
作者 | 顾兆军、任怡彤、刘春波、王志 |
绘制单位 | 中国民航大学信息安全测评中心、中国民航大学信息安全测评中心、中国民航大学计算机科学与技术学院、中国民航大学信息安全测评中心、南开大学人工智能学院 |
更多格式 | 高清、无水印(增值服务) |