《表1 Bert模型面对不同攻击时的性能指标》
实验对比几种常见的防御方法:数据增强(DA)、对抗训练(Adv)以及基于原补偿策略的ScRNN矫正网络。模型在不同防御方法下的文本分类正确率的如表1所示,结果显示Bert在不使用任何防御方法进行一个普通文本分类任务时正确率高达88.4%,但是在面对存在攻击样本的数据集时正确率大幅度下降:替换字符(61.1%)、删除字符(57.6%)、增加字符(47.2%)。在添加防御方法后,在无攻击状态下虽然正确率有小幅下降,如BERT+ScRNN(86.9%),但是在对抗攻击样本的攻击状态中却有着更优异的表现(80.2%)。在引入基于高斯分布的重构中性词后,效果在原实验结果上提升了1个百分点(81.8%)。
图表编号 | XD00139864000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.15 |
作者 | 牟志、殷锋、袁平 |
绘制单位 | 四川大学计算机学院、西南民族大学计算机科学与技术学院、重庆第二师范学院数学与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |