《表2:一种C程序代码相似度检测方法》
本文提出的适用于C程序代码的相似度检测方法利用正则表达式对C程序代码进行特征词的提取,所以构建一个C语言语法特征词与正则表达式的对应关系表,如表2所示。根据表2所列的特征词的正则表达式,在对C程序代码提取特征词的过程中,构建一个正则特征向量,即提取当前已经预处理过的C程序代码中所有特征词的个数,生成一个和该C程序代码所对应的特征向量,向量共36个元素,从第一个元素到最后一个元素分别对应于表1所列的每个特征词在一段C程序代码中出现的次数。
图表编号 | XD0017826900 严禁用于非法目的 |
---|---|
绘制时间 | 2018.06.25 |
作者 | 王卉 |
绘制单位 | 河南师范大学计算机与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |