《表7 Ambari数据集结果》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于深度学习的安全缺陷报告预测方法实证研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在文本分类问题中，不同类型样本的比例会影响最终预测结果准确率[29].因此在这个RQ中，我们拟分析采用深度学习模型进行SBR预测问题中，不同正负样本比例对模型的预测性能可能产生的影响.我们对4个小规模数据集和1个大规模数据集采用不同的采样策略，并计算使用TextCNN和Attention+TextRNN预测模型时所得的F1-score值.对于4个小规模数据集Ambari、Camel、Derby和Wicket，我们采用欠采样方法，随机减少训练样本中的负样本数量，使其样本比例达到拟定比例设置Nnsbr:Nsbr=x，x=1，5，10，其结果见表7～表10（Nnsbr表示参与实验的NSBR数量，Nsbr表示参与实验的SBR的数量）.为了分析不同深度学习模型的迭代表现，我们打印了两个模型在整个实验过程中（共1 000次迭代）F1-score随着迭代进行的变化情况，表中所给出的是1 000次迭代中所取得的最优F1-score.同时，我们在表格第3列给出了取得最优值的迭代次数.

图表编号	XD00168928400 严禁用于非法目的
绘制时间	2020.05.01
作者	郑炜、陈军正、吴潇雪、陈翔、夏鑫
绘制单位	西北工业大学软件学院、空天地海一体化大数据应用技术国家工程实验室(西北工业大学)、大数据存储与管理工业和信息化部重点实验室(西北工业大学)、西北工业大学软件学院、西北工业大学自动化学院、西北工业大学软件学院、南通大学信息科学技术学院、Faculty of Information Technology, Monash University
更多格式	高清、无水印（增值服务）