《表4 基于AVClass的恶意代码样本集标签》
在恶意代码分类的实验中,由于AVClass将样本集中的恶意代码划分为了453个家族,其中有431个家族的恶意样本不超过200个。这相对于总样本容量来说有着数量级的差距,因而难以对所有的家族进行全面性的研究,遂选取了样本容量前15的恶意代码家族,其家族名与样本数量如表4所示。由于长尾效应,此15个家族仅保留了13 786个恶意样本。为保证实验的统一性,对变量进行控制,在采取聚类方法获取标签的分类器搭建实验中,也使用了这13 786个恶意样本。在赋予标签的过程中,将这13 786个样本通过K-means的方法聚类成了15类,其各类别样本个数如表4和5所示。
图表编号 | XD0090294700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 韩金、单征、赵炳麟、孙文杰 |
绘制单位 | 数学工程与先进计算国家重点实验室、数学工程与先进计算国家重点实验室、数学工程与先进计算国家重点实验室、数学工程与先进计算国家重点实验室 |
更多格式 | 高清、无水印(增值服务) |