ATGSL 是一种针对黑盒文本攻击的无监督文本生成框架。通过结合启发式搜索算法(ATGSL-SA)和条件生成模型,生成语义相似度高、质量较好的对抗样本。论文地址:Adversarial Text Generation by Search and Learning。
准备工作#
数据集
- IMDB:用于二元情感分类任务的高级电影评论数据集,共 50000 条电影评论。
目标模型
- BERT
ATGSL 是一种针对黑盒文本攻击的无监督文本生成框架。通过结合启发式搜索算法(ATGSL-SA)和条件生成模型,生成语义相似度高、质量较好的对抗样本。论文地址:Adversarial Text Generation by Search and Learning。
数据集
目标模型