《表4 基于AVClass的恶意代码样本集标签》

《表4 基于AVClass的恶意代码样本集标签》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于软件基因的Android恶意软件检测与分类》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在恶意代码分类的实验中,由于AVClass将样本集中的恶意代码划分为了453个家族,其中有431个家族的恶意样本不超过200个。这相对于总样本容量来说有着数量级的差距,因而难以对所有的家族进行全面性的研究,遂选取了样本容量前15的恶意代码家族,其家族名与样本数量如表4所示。由于长尾效应,此15个家族仅保留了13 786个恶意样本。为保证实验的统一性,对变量进行控制,在采取聚类方法获取标签的分类器搭建实验中,也使用了这13 786个恶意样本。在赋予标签的过程中,将这13 786个样本通过K-means的方法聚类成了15类,其各类别样本个数如表4和5所示。