《表1 代码的表征形式:基于机器学习的软件漏洞挖掘方法综述》
向量表示是机器学习模型的实际输入,所以需要将源数据转换为能够表现漏洞特性的向量形式.由于需要保留源数据的语义信息(例如数据依赖和控制依赖),通常引入中间表示作为源数据与其对应的向量表示之间的“桥梁”[31].中间表示即本文提到的代码表征,好的表征形式可以最大程度地从原始数据中提取特征,具有更丰富的漏洞特性表达能力.常用的代码表征形式有代码度量、Token序列、抽象语法树和图,目前,相关研究主要基于这4种表征形式进行优化和变种,4种形式的特征来源、检测速度及检测效果的对比关系见表1.
图表编号 | XD00168938300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.01 |
作者 | 李韵、黄辰林、王中锋、袁露、王晓川 |
绘制单位 | 国防科技大学计算机学院、国防科技大学计算机学院、中国人民解放军61302部队、国防科技大学计算机学院、国防科技大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |