《表4 实验数据集切分：基于集成学习投票算法的Android恶意应用检测》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于集成学习投票算法的Android恶意应用检测》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

本文使用由良性应用程序和恶意应用程序组成的大型应用程序集来验证本文提出的MASV方法。应用程序数据来自北京交通大学Wang团队[1]所整理收集的2014年和2015年的Android应用功能集。该数据集总共231 619个应用程序，包括213 256个良性应用程序和18 363个恶意应用程序。使用Virus Total标记良性应用程序，如果Virus Total中的防病毒引擎不足以将该应用视为恶意应用，会将其视为良性应用。数据预处理中将App样本转换为LIBSVM格式，每行描述一个App样本，第一列表示分类标签，其余列表示功能特征。本实验使用欠采样，去掉部分良性样本，使得恶意样本和良性样本数量平衡，最终使用的数据集良性样本和恶意样本数量如表4所示。分层选择80%的样本作为训练数据，其余20%的样品作为测试数据。根据应用市场的分类，目前获取的APK数量如表5所示。

图表编号	XD00188984200 严禁用于非法目的
绘制时间	2020.11.15
作者	赵宇鑫、努尔布力、艾壮
绘制单位	新疆大学软件学院、新疆大学网络中心、新疆大学信息科学与工程学院
更多格式	高清、无水印（增值服务）