《表2 数据集样本大小：基于卷积神经网络的JavaScript恶意代码检测方法》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于卷积神经网络的JavaScript恶意代码检测方法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

分类模型的生成需要有训练集和测试集。所以对于良性的数据，使用爬虫工具Heritrix对Alexa’s Top排名靠前的网站进行爬取，因每天访问量巨大安全性高，可以认为是安全的。对于恶意样本的收集，首先搜集知名网站PhishTank的恶意URL站点，然后提取出其链接并使用Google SafeBrowsing Api进行检测，筛选出其中的恶意代码。实验中，收集了9 303个良性的和3 215个恶意的JavaScript脚本。并对良性的JavaScript样本标记为0，对恶意的JavaScript脚本标记为1。经过处理后最终获得2 120个JavaScript恶意代码和3 680个良性的JavaScript代码。实验准备了两个数据集，一个是用于对比实验的JavaScript代码示例数据集，另一个是将JavaScript代码示例转换为灰阶图像的图像数据集。将数据集三分之二作为训练集，三分之一作为测试集。表2详述了每组样本的大小。

图表编号	XD0090182900 严禁用于非法目的
绘制时间	2019.09.15
作者	龙廷艳、万良、邓烜堃
绘制单位	贵州大学计算机科学与技术学院、贵州大学计算机科学与技术学院、贵州大学计算机科学与技术学院
更多格式	高清、无水印（增值服务）