《表2 数据源统计:基于信息检索的软件缺陷定位方法综述》
表2对IRBL方法使用的数据源信息进行了统计,根据该表我们发现:缺陷报告和程序模块作为IRBL方法的必要输入,对每个IRBL方法都不可或缺,因此涉及的论文数最多.其他数据源涉及的论文数则明显偏少.研究人员主要从程序模块和缺陷报告的相关性考虑,挖掘多种信息,仅有少数方法考虑从程序模块缺陷概率的角度出发.在缺陷报告和程序模块相关性度量中,从文献[18,21]的参数设置比例我们发现:对IRBL方法而言,基于文本信息计算的相关度的权重显著大于基于相似缺陷报告和堆栈跟踪计算的相关度的权重,基于文本信息计算的相关度起决定作用,后两者起着优化作用.将缺陷报告与程序模块相关性和程序模块缺陷概率相比时,缺陷报告与程序模块相关性起主要作用,程序模块缺陷概率起次要作用[34].为此,有许多研究人员直接考虑从缺陷报告和程序模块的文本内容出发,关注于提升缺陷报告和缺陷程序模块的关联度,着重解决缺陷报告和程序模块的词汇不匹配问题.
图表编号 | XD00207315900 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.01 |
作者 | 李政亮、陈翔、蒋智威、顾庆 |
绘制单位 | 计算机软件新技术国家重点实验室(南京大学)、计算机软件新技术国家重点实验室(南京大学)、南通大学信息科学技术学院、计算机软件新技术国家重点实验室(南京大学)、计算机软件新技术国家重点实验室(南京大学) |
更多格式 | 高清、无水印(增值服务) |