《表2 数据集样本大小:基于卷积神经网络的JavaScript恶意代码检测方法》

《表2 数据集样本大小:基于卷积神经网络的JavaScript恶意代码检测方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于卷积神经网络的JavaScript恶意代码检测方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

分类模型的生成需要有训练集和测试集。所以对于良性的数据,使用爬虫工具Heritrix对Alexa’s Top排名靠前的网站进行爬取,因每天访问量巨大安全性高,可以认为是安全的。对于恶意样本的收集,首先搜集知名网站PhishTank的恶意URL站点,然后提取出其链接并使用Google SafeBrowsing Api进行检测,筛选出其中的恶意代码。实验中,收集了9 303个良性的和3 215个恶意的JavaScript脚本。并对良性的JavaScript样本标记为0,对恶意的JavaScript脚本标记为1。经过处理后最终获得2 120个JavaScript恶意代码和3 680个良性的JavaScript代码。实验准备了两个数据集,一个是用于对比实验的JavaScript代码示例数据集,另一个是将JavaScript代码示例转换为灰阶图像的图像数据集。将数据集三分之二作为训练集,三分之一作为测试集。表2详述了每组样本的大小。