《表1 数据集样本大小:自编码网络在JavaScript恶意代码检测中的应用研究》

《表1 数据集样本大小:自编码网络在JavaScript恶意代码检测中的应用研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《自编码网络在JavaScript恶意代码检测中的应用研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文的数据包括恶意的JavaScript代码样本和安全的JavaScript代码样本。一方面来源于文献[7]开源的数据集;一方面对Alexa’s Top排名靠前的网站爬取,得到安全的JavaScript代码样本,从PhishTank公布的网站中使用Python Scrapy获取恶意的URL站点,并利用Google Safe Browsing API进行站点筛选,得到恶意代码样本。实验中,最终获得21 000个良性JavaScript脚本和7 068个恶意JavaScript脚本。将数据集的90%作为训练集,10%作为测试集,数据集样本大小如表1所示。