百分点认知智能实验室出品:智能问答中的对抗攻击及防御策略
发布时间:2020-04-28 15:16:58 所属栏目:经验 来源:百分点
导读:深度学习模型应用广泛,但其自身有一定的脆弱性,即模型输入的微小改动,在不影响人判断的情况下,可能使模型的输出出错,这个过程被称为对模型的对抗攻击。针对对抗攻击的研究,早期集中在图像领域,近几年,文本领域也逐渐增多。2019年,百分点从业务实际
上式表达的意思即,对样本x加入的扰动radv是可以使得预测为分类y的损失最大,radv的定义如下: ![]() 在具体训练时采取的损失,是原始损失与对抗损失的组合。实验表明,使用FGM训练的模型和没有使用的模型相比,验证集的宏F1值能有约0.5~1个百分点的提升。 5.5 各种方法的效果 总结上面提到的几种方法,在该任务上的效果如下表: 方法 效果 数据增强 ↑ 1.5%~2% 智能纠错 ↑ 2%~3% Focal Loss ↑ 0.5% Fast Gradient Method ↑ 0.5%~1% (编辑:威海站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |