《表4 基于AVClass的恶意代码样本集标签》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于软件基因的Android恶意软件检测与分类》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在恶意代码分类的实验中，由于AVClass将样本集中的恶意代码划分为了453个家族，其中有431个家族的恶意样本不超过200个。这相对于总样本容量来说有着数量级的差距，因而难以对所有的家族进行全面性的研究，遂选取了样本容量前15的恶意代码家族，其家族名与样本数量如表4所示。由于长尾效应，此15个家族仅保留了13 786个恶意样本。为保证实验的统一性，对变量进行控制，在采取聚类方法获取标签的分类器搭建实验中，也使用了这13 786个恶意样本。在赋予标签的过程中，将这13 786个样本通过K-means的方法聚类成了15类，其各类别样本个数如表4和5所示。

图表编号	XD0090294700 严禁用于非法目的
绘制时间	2019.06.01
作者	韩金、单征、赵炳麟、孙文杰
绘制单位	数学工程与先进计算国家重点实验室、数学工程与先进计算国家重点实验室、数学工程与先进计算国家重点实验室、数学工程与先进计算国家重点实验室
更多格式	高清、无水印（增值服务）