《表1 代码的表征形式:基于机器学习的软件漏洞挖掘方法综述》

《表1 代码的表征形式:基于机器学习的软件漏洞挖掘方法综述》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于机器学习的软件漏洞挖掘方法综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

向量表示是机器学习模型的实际输入,所以需要将源数据转换为能够表现漏洞特性的向量形式.由于需要保留源数据的语义信息(例如数据依赖和控制依赖),通常引入中间表示作为源数据与其对应的向量表示之间的“桥梁”[31].中间表示即本文提到的代码表征,好的表征形式可以最大程度地从原始数据中提取特征,具有更丰富的漏洞特性表达能力.常用的代码表征形式有代码度量、Token序列、抽象语法树和图,目前,相关研究主要基于这4种表征形式进行优化和变种,4种形式的特征来源、检测速度及检测效果的对比关系见表1.