《表7 Ambari数据集结果》

《表7 Ambari数据集结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于深度学习的安全缺陷报告预测方法实证研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在文本分类问题中,不同类型样本的比例会影响最终预测结果准确率[29].因此在这个RQ中,我们拟分析采用深度学习模型进行SBR预测问题中,不同正负样本比例对模型的预测性能可能产生的影响.我们对4个小规模数据集和1个大规模数据集采用不同的采样策略,并计算使用TextCNN和Attention+TextRNN预测模型时所得的F1-score值.对于4个小规模数据集Ambari、Camel、Derby和Wicket,我们采用欠采样方法,随机减少训练样本中的负样本数量,使其样本比例达到拟定比例设置Nnsbr:Nsbr=x,x=1,5,10,其结果见表7~表10(Nnsbr表示参与实验的NSBR数量,Nsbr表示参与实验的SBR的数量).为了分析不同深度学习模型的迭代表现,我们打印了两个模型在整个实验过程中(共1 000次迭代)F1-score随着迭代进行的变化情况,表中所给出的是1 000次迭代中所取得的最优F1-score.同时,我们在表格第3列给出了取得最优值的迭代次数.