论文浅尝 - ICLR2021 | 从信息论的角度提高语言模型的鲁棒性

笔记整理 | 胡楠,东南大学


来源:ICLR 2021

论文下载地址:https://arxiv.org/pdf/2010.02329.pdf

动机

最近的研究表明,BERT和RoBERTa这种基于BERT的模型容易受到文字对抗攻击的威胁。论文旨在从信息理论的角度解决此问题并提出InfoBERT,这是一种用于对预训练语言模型进行健壮微调的新颖学习框架。InfoBERT包含两个用于模型训练的基于互信息的正则器:(i)Information Bottleneck regularizer,用于抑制输入和特征表示之间的嘈杂的互信息;(ii)Anchored Feature regularizer,可增加局部稳定特征和全局特征之间的相互信息。论文提出一种方法可以从理论上分析和提高标准训练和对抗训练中语言模型的鲁棒性。大量实验表明,InfoBERT在自然语言推理(NLI)和问题解答(QA)任务的多个对抗性数据集上均达到了最先进的鲁棒准确性。

贡献

论文的贡献总结如下。(i)从信息论的角度提出了一种新颖的学习框架InfoBERT,旨在有效地提高语言模型的鲁棒性。(ii)提供了关于模型鲁棒性的原则性理论分析,并提出了两个基于MI的正则化器来细化局部和全局特征,可将其应用于针对不同NLP任务的标准训练和对抗训练。(iii)全面的实验结果表明,InfoBERT可以在不牺牲良性准确性的情况下大幅提高鲁棒准确性,从而在NLI和QA任务的多个对抗性数据集上产生了最先进的表现。

实验

Adversarial Datasets:(I)Adversarial NLI(ANLI)是大型NLI基准,通过迭代、对抗性的、人为模型的循环过程收集来攻击BERT和RoBERTa。ANLI数据集是强大的对抗性数据集,可轻松将BERTLarge的准确性降低至0%。(II)Adversarial  SQuAD数据集是一种对抗性QA基准数据集,由一组手工规则生成并通过众包进行精炼。由于没有提供对抗训练数据,因此论文仅在良性SQuAD训练数据上微调RoBERTa Large,并在良性和对抗性测试集上测试模型。(III)TextFooler是最新的词级对抗攻击方法,用于生成对抗示例。为了创建对抗性评估数据集,论文分别从SNLI和MNLI的测试集中采样了1,000个示例,并针对BERT Large和RoBERTa Large运行TextFooler以获取对抗性文本示例。

Baselines:由于基于IBP的方法还不能应用于大规模的语言模型,并且基于随机平滑的方法实现了有限的认证鲁棒性,因此论文将InfoBERT与基于对抗训练的三个竞争基线进行了比较:(I)FreeLB在微调阶段对语言模型进行对抗性训练,以提高泛化能力。(二)SMART在微调过程中使用对抗训练作为平滑诱导正则化和Bregman近点优化,以提高语言模型的泛化和鲁棒性。(三)ALUM在训练前和微调阶段都进行对抗性训练,在广泛的NLP任务中获得了显著的性能增益。由于对抗性训练的高计算成本,论文将InfoBERT与ALUM和SMART进行了比较,并与原始文献中的最佳结果进行了比较。

Evaluation Metrics:我们使用稳健精度或稳健F1评分来衡量基线模型和InfoBERT在面对对手数据时的稳健程度。具体来说,鲁棒精度的计算方法是:,其中Dadv是对抗数据集,y是地面真值标签,arg max选择logits最高的类,是指示函数。类似地,鲁棒F1分数的计算公式为:,其中是真实答案a和预测答案arg max之间的F1分数,arg max选择概率最高的答案。

实验结果:

论文从信息论的角度提出了一种新的学习框架InfoBERT,在理论分析的支持下,InfoBERT为提高BERT和RoBERTa对NLI和QA任务的鲁棒性提供了一种原则性的方法。综合实验表明,InfoBERT在对抗性数据集上取得了新的进展,为提高语言模型表征学习的鲁棒性提供了一种新的有效方法。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478425.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 74. 搜索二维矩阵(二分查找)

1. 题目 编写一个高效的算法来判断 m x n 矩阵中,是否存在一个目标值。该矩阵具有如下特性: 每行中的整数从左到右按升序排列。 每行的第一个整数大于前一行的最后一个整数。 示例 1: 输入: matrix [[1, 3, 5, 7],[10, 11, 16, 20],[23, 30, 34,…

AINLP-Archive:AINLP文章存档计划

AINLP-Archive:AINLP文章存档计划:https://mp.weixin.qq.com/s/dCzmlRLTb0aSxkq7jefc_g

美团点评旅游搜索召回策略的演进

本文内容与6月22日第22期美团点评技术沙龙“美团点评AI实践”主题演讲一致,欢迎大家去现场和作者交流。 关注“美团点评技术团队”微信公众号,第一时间获取沙龙最新信息,还可以查阅往期沙龙PPT/视频。 美团点评作为最大的生活服务平台&#x…

从论文到PPT,一键生成!从此报告不用愁!

文 | 子龙编 | 小轶俗话说:“行百步者半九十”,论文接受固然可喜可贺,然而这只是万里长征第一步。一份具有影响力的工作少不了一个后期的宣传,做好一个PPT绝对是一个技术活。不知道小伙伴们平时怎么做PPT,是复制粘贴长…

资源征集 | 2021年全国知识图谱与语义计算大会开放资源征集(Resource Track)通知...

大会时间:2021年8月18日-21日,广州资源征集截止: 2021年5月20日开放的资源对促进知识图谱和语义计算相关的科学研究及企业应用十分重要。CCKS 2021将组织开放资源征集(Resource Track),旨在支持和促进学术界和工业界的…

搜索引擎和网站中的高级搜索技巧

“ 在浩瀚的互联网中精准的找到需要的信息是一项必备的技能,而各大搜索引擎google,baidu,bingd等都提供有高级搜索技巧和语句可以帮助我们更快速更准确的找到我们需要的信息。” 01 — 关键字搜索 在搜索时使用关键字搜索是最基础的搜索技巧,简而言之…

WebView性能、体验分析与优化

在App开发中,内嵌WebView始终占有着一席之地。它能以较低的成本实现Android、iOS和Web的复用,也可以冠冕堂皇的突破苹果对热更新的封锁。 然而便利性的同时,WebView的性能体验却备受质疑,导致很多客户端中需要动态更新等页面时不得…

LeetCode 240. 搜索二维矩阵 II(二分查找 分治)

文章目录1. 题目2. 解题2.1 从左下角或者右上角开始搜索2.2 分治算法1. 题目 编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target。该矩阵具有以下特性: 每行的元素从左到右升序排列。 每列的元素从上到下升序排列。 示例: 现有矩阵 matrix 如下…

NLP哪个细分方向最具社会价值?

文 | 小戏让我们来大胆设想一个场景,老板突然发财搞到一笔钱,大手一挥给你五百万,让你去做自然语言处理的研究,你该先研究哪一个细分领域?机器翻译好像不错,信息抽取也很必要,对话系统更是 NLP …

论文浅尝 | 通过阅读实体描述进行零样本的实体链接

笔记整理 | 赖泽升,东南大学本科生来源:ACL2019动机先前实体链接的大多数工作都着重于与通用实体数据库的链接,通常希望链接到专门的实体词典,例如法律案件,公司项目描述,小说中的字符集或术语表。但这些工…

知识图谱-数据集

原文链接:https://blog.csdn.net/qq_21097885/article/details/104562276 DBpedia 网址:https://wiki.dbpedia.org/ 简介: DBpedia 是一个很特殊的语义网应用范例,它从维基百科(Wikipedia)的词条里撷取出结构化的资料,…

LeetCode 29. 两数相除(位运算)

1. 题目 给定两个整数,被除数 dividend 和除数 divisor。将两数相除,要求不使用乘法、除法和 mod 运算符。 返回被除数 dividend 除以除数 divisor 得到的商。 示例 1: 输入: dividend 10, divisor 3 输出: 3示例 2: 输入: dividend 7, divisor -…

Git使用的奇技淫巧

源 | Linux公社Git 版本对比相关操作[1] 输出工作区和暂存区的不同。git diff[2] 展示暂存区和最近版本的不同git diff --cached[3] 展示暂存区、工作区和最近版本的不同git diff HEAD[4] 展示本地仓库中任意两个 commit 之间的文件变动git diff <commit-id> <commit-…

Python-接口开发入门

Python-接口开发入门&#xff1a;https://www.cnblogs.com/zhxwind/p/11202629.html

Hyperloop,让发布简洁高效

Hyperloop 是什么&#xff1f; Hyperloop 是服务于美团点评客户端的组件发版、持续集成、App 打包构建、资源调度等各个环节的发布调度系统。名称起源于美国 Elon Musk 构想的 Hyperloop 超级高铁&#xff0c;象征着现代、简洁、高效。 Hyperloop 提供了一站式的平台&#xff0…

论文浅尝 | 基于潜在类别信息的实体链接

笔记整理 | 黄一凡&#xff0c;东南大学本科生来源&#xff1a;AAAI2020链接&#xff1a;https://arxiv.org/pdf/2001.01447v1.pdf一、简介作者意识到在利用预训练模型进行实体链接时&#xff0c;往往会将类别信息忽略&#xff0c;因此会导致模型将指称链接到拥有错误类别的错误…

LeetCode 166. 分数到小数(小数除法)

1. 题目 给定两个整数&#xff0c;分别表示分数的分子 numerator 和分母 denominator&#xff0c;以字符串形式返回小数。 如果小数部分为循环小数&#xff0c;则将循环的部分括在括号内。 示例 1: 输入: numerator 1, denominator 2 输出: "0.5"示例 2: 输入: …

百度飞桨弯道超车了吗?!

事情是这样的...前不久&#xff0c;小夕注意到了一份来自权威评测机构IDC发布的《2020年下半年深度学习平台市场份额报告》&#xff1a;▲IDC:2020年中国深度学习平台市场综合份额top 5立刻惊了&#xff01;印象里百度飞桨三年前还只是一个低调、小而美的深度学习框架&#xff…

百度开源 FAQ 问答系统(AnyQ)安装---Linux(无docker)+小白编译AnyQ-dockerlinux[CentOs]

小白编译AnyQ-docker&linux[CentOs]——AnyQ系列之一https://blog.csdn.net/u011818766/article/details/104117469 原文链接&#xff1a;https://blog.csdn.net/qq_28385535/article/details/83213822 1.系统下载及环境安装 1.github地址&#xff1a;https://codeload.g…

美团点评酒旅数据仓库建设实践

在美团点评酒旅事业群内&#xff0c;业务由传统的团购形式转向预订、直连等更加丰富的产品形式&#xff0c;业务系统也在迅速的迭代变化&#xff0c;这些都对数据仓库的扩展性、稳定性、易用性提出了更高要求。对此&#xff0c;我们采取了分层次、分主题的方式&#xff0c;本文…