颠覆认知!数据增强、正则化可导致不易察觉的灾难?

b762611ce23daeaa888eef1fcabe4244.png

文 | 子龙
编 | 智商掉了一地

作为常用的炼丹技巧,正则化 (Regularization) 和数据增强 (Data Augmentation, DA) 常常被简单粗暴地引入模型中来防止数据过拟合,进而提升最后的 performance。如果说,更高的performance就意味着更好的泛化能力,那么形式并不复杂的正则化和数据增强简直就是各大排名的屠榜利器、人工智能的指路明灯。然而,事情并不会这么简单,万事皆有代价,今天介绍的文章将会指出:虽然引入正则化和数据增强表面上能够提高模型的整体效果,但却会导致类别之间的不均衡问题。简单来说,就是虽然平均来看,整体效果有所提升,但其中却牺牲了部分类别的效果,而“偏心”于另外一些类别。

论文题目:
The Effects of Regularization and Data Augmentation are Class Dependent

论文链接:
https://arxiv.org/abs/2204.03632

Arxiv访问慢的小伙伴也可以在 【夕小瑶的卖萌屋】订阅号后台回复关键词 【0609】 下载论文PDF~

为了佐证这一结论,作者给出了数学上的严格证明,进而结合实验结果进一步分析,让我们一起来看看吧。

基本原理

文章首先将问题表述成如下形式:

训练数据:

402 Payment Required

,假设 和 之间存在关系 ,即 ,那么我们模型的目的就是拟合函数 ,使得 和 尽可能的在训练数据上接近。数据增强(DA)可以一般化为,给定参数 ,会生成一个基于 的新样本加入训练。

根据上述定义,作者声称:如果DA中的参数无法保证生成的新样本 和对应的原数据点 位于 的同一“水平集(level-set)”,同时模型能够最小化 training loss,那么就会在 上产生无法消除的偏差

即:

402 Payment Required

其中第一项表示 生成的数据不在同一 level-set 上,第二项表示模型有能力最小化 loss。篇幅有限,具体证明过程可以参照论文,其中心思想是:如果 无法在同一 level-set 上生成数据,同时模型能够最小化 loss,模型习得的函数 与 就会有偏差,即 。

(level-set 指:;即 )

于是,除非同时改变新数据 的标签 来消除 在 level-set 上产生的偏移,否则数据增强算法总会引入一定的偏差。若上述公式中第一项为 0,即不存在同一 level-set 上的偏差,这一性质被称为"label preserving",而这一性质依赖于特定的类别,即一部分类别偏差更小,label-perserving 的能力更强,当相同的数据增强的方法被运用于所有类别,自然而然,模型就会偏向于部分 label-preserving 更强的类别,进而产生类别间的不均衡

具体实例

3815d86d1ef68697342d2e2844e8d118.png

图中展示了运用不同数据增强的方法,对常见图片分类模型特定类别的分类效果,横轴是数据增强的程度,每种方法各不相同,但从整体趋势可以看出,对一些类别(红色)而言,尽管提高数据增强的比例,模型依旧能够学到足够的信息,但对另外一些类别(黑色),其结果下降明显

根据之前的定义,红色所对应的类别 label preserving 的能力更强,黑色所对应的类别就相对较弱,这进一步佐证了作者在前文中的证明。

Weight Decay呢?

前文论述了 DA 会导致类别间的不均衡问题,那其他的正则方法呢?作者进一步给出了 Weight Decay 的实验结果。Weight Decay 是指在原本的损失函数上添加 ,也就是我们常说的 L2 正则。作者参照之前数据增强的实验,罗列了新的结果:

cfc1259fff2c7d55a32a925ab70b4dd1.png

其中蓝色表示整体的平均分类准确率,红色和黑色表示对应的类别。与数据增强类似,虽然 Weight Decay 可以提升整体的平均分类效果,但是会导致类别间的不均衡

小结

这篇文章主要讨论了一种常见的现象:引入正则或数据增强后导致类别间效果不均衡,并给出严格的证明和实验结果。无论是各种不同的数据增强结果,抑或是最为常见的正则方法 Weight Decay,即便往往使平均效果有所提升,但都会引入类别间的不均衡问题。可见,即使总体效果出色,也要关心一下各个类别更为具体的数据,否则就只是刷榜的机器学习,其泛化能力并不一定出色,也就不能完美地运用于具体的应用场景中。

394d323c3381b4a800e7722c8fb3784f.png萌屋作者:子龙(Ryan)

本科毕业于北大计算机系,曾混迹于商汤和MSRA,现在是宅在UCSD(Social Dead)的在读PhD,主要关注多模态中的NLP和data mining,也在探索更多有意思的Topic,原本只是贵公众号的吃瓜群众,被各种有意思的推送吸引就上了贼船,希望借此沾沾小屋的灵气,paper++,早日成为有猫的程序员!

作品推荐:

1.别再搞纯文本了!多模文档理解更被时代需要!

2.Transformer哪家强?Google爸爸辨优良!

3.预训练语言真的是世界模型?

79075098943541b839c3b3dbb9f8b666.png后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

552ba67aaa39f5b7633cfa61642edb4c.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477295.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

spring-boot-starter-swagger 1.3.0.RELEASE:新增对JSR-303的支持和host的配置

简介 该项目主要利用Spring Boot的自动化配置特性来实现快速的将swagger2引入spring boot应用来生成API文档,简化原生使用swagger2的整合代码。 源码地址 GitHub:https://github.com/dyc87112/spring-boot-starter-swagger码云:https://git…

LeetCode 1353. 最多可以参加的会议数目(排序+贪心,优先队列,难)

文章目录1. 题目2. 解题2.1 错误解2.2 超时解2.3 通过解2.4 大佬解1. 题目 给你一个数组 events&#xff0c;其中 events[i] [startDayi, endDayi] &#xff0c;表示会议 i 开始于 startDayi &#xff0c;结束于 endDayi 。 你可以在满足 startDayi < d < endDayi 中的…

深圳率先立法:支持L3自动驾驶上路,凡公开道路皆可行

文 | 万博 发自 副驾寺源 | 智能车参考全国第一个开放L3级自动驾驶的城市&#xff0c;就要来了。不是自动驾驶第一城的广州&#xff0c;也不是拥有全球首个高级别自动驾驶示范区的北京&#xff0c;最先吃螃蟹的&#xff0c;是深圳。根据深圳人大常委会发布的2022年立法计划&…

在Pivotal Web Service上发布Spring Boot应用

Hello PWS&#xff08;Pivotal Web Service&#xff09;&#xff0c;由 Pivotal 公司提供的 &#xff0c;可以运行Java, Grails, Play, Spring, Node.js, Ruby on Rails, Sinatra or Go 等Web应用的服务。本文将介绍一个 Hello World 级别的 Spring Boot 应用发布到 PWS 的过程…

CVPR 2022 | FAIR提出MaskFeat:自监督视觉预训练新方法!灵感之一来自16年前CVPR论文...

编 | 小咸鱼 好困源 | 新智元【导读】近日&#xff0c;北大校友、约翰霍普金斯大学博士生提出了一种新的方法&#xff1a;MaskFeat&#xff0c;摘下12个SOTA&#xff01;这是一个能用于视频模型的自监督预训练方法&#xff1a;掩码特征预测&#xff08;MaskFeat&#xff09;。论…

简化Swagger使用的自制Starter:spring-boot-starter-swagger,欢迎使用和吐槽

项目简介 该项目主要利用Spring Boot的自动化配置特性来实现快速的将swagger2引入spring boot应用来生成API文档&#xff0c;简化原生使用swagger2的整合代码。 GitHub&#xff1a;https://github.com/dyc87112/spring-boot-starter-swagger码云&#xff1a;http://git.oschi…

LeetCode 1354. 多次求和构造目标数组(优先队列+逆向思考)

1. 题目 给你一个整数数组 target 。一开始&#xff0c;你有一个数组 A &#xff0c;它的所有元素均为 1 &#xff0c;你可以执行以下操作&#xff1a; 令 x 为你数组里所有元素的和选择满足 0 < i < target.size 的任意下标 i &#xff0c;并让 A 数组里下标为 i 处的…

Spring Boot自动化配置的利弊及解决之道

Spring Boot中的双刃剑&#xff1a;自动化配置 在之前发布的Spring Boot基础教程系列文章中&#xff0c;我们通过各种功能性示例体验了Spring Boot的自动化配置给我们所带来的超便利的新开发方式。但是&#xff0c;在一些情况下Spring Boot的自动化配置也会给我们惹来不少的麻…

人在ACL2022,无人戴口罩我有些慌

文 | 小伟大家好&#xff0c;我是阿伟 (不是杰哥不要的阿伟)&#xff0c;NLP小萌新&#xff0c;好久不见&#xff01;之前忙着赶ddl一直没时间写文&#xff0c;趁着这次去都柏林参加了人生第一次线下ACL会议的机会&#xff0c;把自己的一些体验分享给大家。22号早上到了都柏林发…

剑指Offer - 面试题32 - I. 从上到下打印二叉树(按层BFS遍历,queue)

1. 题目 从上到下打印出二叉树的每个节点&#xff0c;同一层的节点按照从左到右的顺序打印。 例如: 给定二叉树: [3,9,20,null,null,15,7],3/ \9 20/ \15 7 返回&#xff1a; [3,9,20,15,7]提示&#xff1a; 节点总数 < 1000来源&#xff1a;力扣&#xff08;LeetCode…

Spring Boot中使用Actuator的/info端点输出Git版本信息

对于Spring Boot的Actuator模块相信大家已经不陌生了&#xff0c;尤其对于其中的/health、/metrics等强大端点已经不陌生&#xff08;如您还不了解Actuator模块&#xff0c;建议先阅读《Spring Boot Actuator监控端点小结》&#xff09;。但是&#xff0c;其中还有一个比较特殊…

管培生走下神坛,“高管捷径”破灭

文 | 翟元元源 | Tech星球曾经令打工人羡慕不已的管培生光环&#xff0c;正逐渐失色。近日&#xff0c;一位叮咚买菜的管培生在某社交平台爆料&#xff0c;管培生这一带有职业光环的角色有着不为人知的B面。“叮咚买菜管培生&#xff0c;别去&#xff0c;快跑。每天12小时以上体…

剑指Offer - 面试题32 - III. 从上到下打印二叉树 III(BFS,queue+stack)

1. 题目 请实现一个函数按照之字形顺序打印二叉树&#xff0c; 即第一行按照从左到右的顺序打印&#xff0c; 第二层按照从右到左的顺序打印&#xff0c; 第三行再按照从左到右的顺序打印&#xff0c;其他行以此类推。 例如: 给定二叉树: [3,9,20,null,null,15,7],3/ \9 20/…

互联网行业,回暖了?

源 | 36氪经过这一年的调整&#xff0c;中国互联网企业或许才算得上真正成熟起来。有统计显示&#xff0c;目前中国互联网公司股价已经缓慢升至 3 个月以来的新高。反映中概股表现的纳斯达克中国金龙指数在近期连涨三天&#xff0c;自5月11日以来更是累计上涨逾40%。利好的信号…

使用Spring Boot Actuator、Jolokia和Grafana实现准实时监控

由于最近在做监控方面的工作&#xff0c;因此也读了不少相关的经验分享。其中有这样一篇文章总结了一些基于Spring Boot的监控方案&#xff0c;因此翻译了一下&#xff0c;希望可以对大家有所帮助。 原文&#xff1a;Near real-time monitoring charts with Spring Boot Actuat…

剑指Offer - 面试题33. 二叉搜索树的后序遍历序列(递归)

1. 题目 输入一个整数数组&#xff0c;判断该数组是不是某二叉搜索树的后序遍历结果。如果是则返回 true&#xff0c;否则返回 false。假设输入的数组的任意两个数字都互不相同。 参考以下这颗二叉搜索树&#xff1a;5/ \2 6/ \1 3 示例 1&#xff1a; 输入: [1,6,3,2,5]…

Geoffrey Hinton 最新访谈:不出五年,我们就会破解大脑的运作机制,但不是通过反向传播...

文 | Geoffrey Hinton整理 | 李梅、黄楠编 | 陈彩娴过去十年&#xff0c;AI 在计算机视觉、语音识别、机器翻译、机器人、医学、计算生物学、蛋白质折叠预测等等领域取得了一个又一个突破&#xff0c;而这些突破的背后&#xff0c;均离不开深度学习。那么&#xff0c;深度学习起…

Spring Boot 1.5.x新特性:动态修改日志级别

前天Spring Boot 1.5终于迎来了第一个RELEASE版本&#xff1a;1.5.0&#xff0c;但是由于一个编译依赖问题在第二天直接连击到了1.5.1。该版本的发布包含了超过320位贡献者的奉献、10000多次的代码提交。 每次Spring Boot版本更新所带来的新特性都是我们每个用户特别关注的。虽…

基于sklearn的LogisticRegression鸢尾花多类分类实践

文章目录1. 问题描述2. 数据介绍2.1 数据描述2.2 数据2.3 数据可视化3. 模型选择3.1 固有的多类分类器3.2 1对多的多类分类器3.3 OneVsRestClassifier3.4 OneVsOneClassifier4. 结果分析5. 附完整代码鸢尾花&#xff08;拼音&#xff1a;yuān wěi huā&#xff09;又名&#…

CMU 提出全新 GAN 结构,GAN 自此迈入预训练大军!

文&#xff5c;林锐众所周知&#xff0c;现在 GAN 的应用是越来越宽泛了&#xff0c;尤其是在 CV 领域。不仅可以调个接口生成新头像图一乐&#xff0c;也可以用 GAN 做数据增强让模型更加健壮。▲嘉然你带我走吧嘉然&#xff01;在CV领域&#xff0c;不像分类、目标检测等任务…