《表1 代码的表征形式：基于机器学习的软件漏洞挖掘方法综述》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于机器学习的软件漏洞挖掘方法综述》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

向量表示是机器学习模型的实际输入，所以需要将源数据转换为能够表现漏洞特性的向量形式.由于需要保留源数据的语义信息（例如数据依赖和控制依赖），通常引入中间表示作为源数据与其对应的向量表示之间的“桥梁”[31].中间表示即本文提到的代码表征，好的表征形式可以最大程度地从原始数据中提取特征，具有更丰富的漏洞特性表达能力.常用的代码表征形式有代码度量、Token序列、抽象语法树和图，目前，相关研究主要基于这4种表征形式进行优化和变种，4种形式的特征来源、检测速度及检测效果的对比关系见表1.

图表编号	XD00168938300 严禁用于非法目的
绘制时间	2020.07.01
作者	李韵、黄辰林、王中锋、袁露、王晓川
绘制单位	国防科技大学计算机学院、国防科技大学计算机学院、中国人民解放军61302部队、国防科技大学计算机学院、国防科技大学计算机学院
更多格式	高清、无水印（增值服务）