《表1 学生提交的SQL示例代码》

《表1 学生提交的SQL示例代码》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种基于编码习惯的SQL语句抄袭检测算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

以表1为例,(a)(b)(c)和(d)分别为四位同学对同一道题进行作答的答案,从语法逻辑上判断这四位同学提交的答案都是正确无误的,但是观察其代码便可看出四位同学的编码习惯大有不同。(a)(b)同学习惯将SQL语句的保留字小写,(c)(d)同学却习惯将保留字大写,(b)(c)(d)同学在保留字之前对代码进行换行,(b)同学习惯将数据库的表名写成简写的形式,而(d)同学会在代码中添加注释信息。不同的学生在做题时提交的代码通常都会遵循自己这一编码习惯。为了确定学生的编码习惯,需要对每个学生提交的每条代码都与其之前编写的所有同类代码进行比较。当相似度小于给定阈值时,代码被标记为疑似抄袭。也就是说,编码习惯的改变暗示了抄袭的可能性。