《表2 恶意代码家族数据集组成》
恶意代码家族样本的有效采集是进行检测分类的基础,数据集搜集的质量和数量会直接影响训练模型的准确率和实验结果。本文实验搜集到的恶意代码样本实验数据集取自网络恶意样本库Virus Share,该样本库是国内外恶意代码研究的重要样本来源,搜集到的数据集包括ELF、Winexe、Crypto Ransom和EK共4个家族4 418个恶意可执行文件。将数据打好标签之后,在每一个恶意代码家族的可执行文件中抽取80%作为训练集,剩下的20%作为测试集。数据集组成由表2所示。
图表编号 | XD00189002000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.15 |
作者 | 王国栋、芦天亮、尹浩然、张建岭 |
绘制单位 | 中国人民公安大学信息技术与网络安全学院、中国人民公安大学信息技术与网络安全学院、中国人民公安大学信息技术与网络安全学院、中国人民公安大学信息技术与网络安全学院 |
更多格式 | 高清、无水印(增值服务) |