《表3 信息增益排行前10的3-gram操作码序列》
本文针对n-gram的操作码序列特征选择做了两部分研究。首先实验利用2-gram、3-gram、4-gram、5-gram提取的操作码序列进行实验,通过表2对比发现,3-gram和4-gram的F值一样且比2-gram、5-gram的F值相对较高,但3-gram的误差率比4-gram更低,因此本文使用3-gram提取的操作码序列作为特征。对3-gram提取的操作码序列进行信息增益计算,表3显示了信息增益排行前10的操作码序列。从表4可知,分类的准确率随特征提取数量的增加而增加,当数量大于900时,分类差异可以接近于0,如图6所示。
图表编号 | XD0090232600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.10 |
作者 | 郎大鹏、丁巍、姜昊辰、陈志远 |
绘制单位 | 哈尔滨工程大学计算机科学与技术学院、中国科学院信息工程研究所中国科学院网络测评技术重点实验室、哈尔滨工程大学计算机科学与技术学院、哈尔滨工程大学计算机科学与技术学院、哈尔滨工程大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |