《表1 实验数据集:DeepTriage:一种基于深度学习的软件缺陷自动分配方法》

《表1 实验数据集:DeepTriage:一种基于深度学习的软件缺陷自动分配方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《DeepTriage:一种基于深度学习的软件缺陷自动分配方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文选取了Bugzilla中Eclipse和Mozilla两个大型开源软件项目的缺陷数据作为实验的数据集,原始数据源于文献[29].以Eclipse为例介绍数据的收集过程.本文选取了2001.10~2011.09这10年间产生的20万个缺陷报告,它们的状态为VERIFIED、决议(resolution)为FIXED.每个缺陷报告对应的总结、描述、评论等文本信息放在一起,组成一个文本,然后进行自然语言处理,主要包括分词、去除非字母表字符、去除停用词、词干提取、词向量化等操作.对于缺陷报告的样本类别,本文将最后一个解决缺陷的开发者作为最终的类别标签,而不是考虑所有在缺陷投掷过程中出现的开发者以及发表过评论的开发者.同样地,本文也收集了1998.04~2011.05这13年间的22万个M ozilla缺陷报告.实验数据集的基本情况如表1所示.