《表7 Ambari数据集结果》
在文本分类问题中,不同类型样本的比例会影响最终预测结果准确率[29].因此在这个RQ中,我们拟分析采用深度学习模型进行SBR预测问题中,不同正负样本比例对模型的预测性能可能产生的影响.我们对4个小规模数据集和1个大规模数据集采用不同的采样策略,并计算使用TextCNN和Attention+TextRNN预测模型时所得的F1-score值.对于4个小规模数据集Ambari、Camel、Derby和Wicket,我们采用欠采样方法,随机减少训练样本中的负样本数量,使其样本比例达到拟定比例设置Nnsbr:Nsbr=x,x=1,5,10,其结果见表7~表10(Nnsbr表示参与实验的NSBR数量,Nsbr表示参与实验的SBR的数量).为了分析不同深度学习模型的迭代表现,我们打印了两个模型在整个实验过程中(共1 000次迭代)F1-score随着迭代进行的变化情况,表中所给出的是1 000次迭代中所取得的最优F1-score.同时,我们在表格第3列给出了取得最优值的迭代次数.
图表编号 | XD00168928400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 郑炜、陈军正、吴潇雪、陈翔、夏鑫 |
绘制单位 | 西北工业大学软件学院、空天地海一体化大数据应用技术国家工程实验室(西北工业大学)、大数据存储与管理工业和信息化部重点实验室(西北工业大学)、西北工业大学软件学院、西北工业大学自动化学院、西北工业大学软件学院、南通大学信息科学技术学院、Faculty of Information Technology, Monash University |
更多格式 | 高清、无水印(增值服务) |