《表2:一种C程序代码相似度检测方法》

《表2:一种C程序代码相似度检测方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种C程序代码相似度检测方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文提出的适用于C程序代码的相似度检测方法利用正则表达式对C程序代码进行特征词的提取,所以构建一个C语言语法特征词与正则表达式的对应关系表,如表2所示。根据表2所列的特征词的正则表达式,在对C程序代码提取特征词的过程中,构建一个正则特征向量,即提取当前已经预处理过的C程序代码中所有特征词的个数,生成一个和该C程序代码所对应的特征向量,向量共36个元素,从第一个元素到最后一个元素分别对应于表1所列的每个特征词在一段C程序代码中出现的次数。