《表5 四种类型数据的平均长度(单位(行数))》

《表5 四种类型数据的平均长度(单位(行数))》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于抽象语法树的智能化漏洞检测系统》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

表4给出了实验结果。可以发现Astor对指针类型的数据(PU-kind)效果是最好的。初步分析是因为指针类型的数据较为复杂,所涉及的数据依赖和控制依赖较多,所以该类型样本的代码长度较大,可以蕴含足够多的语法和语义信息供模型学习。为验证这个观点,本文进一步做了补充实验,统计了四种类型数据的样本平均长度。统计结果如表5所示。可以看出,指针类型数据(PU-kind)的平均长度为28.3,远高于其他三类。这证明该类型数据样本更适合本文所提出的Astor系统是因为其数据较为复杂,代码的长度最大,所包含的信息量是最多,因此可以通过其抽象语法树学到足够多的结构信息。而表4另外三类数据检测结果的F1值与表5中对应的平均长度相结合,可以进一步证明这个结论的准确性。