什么是ResNet

什么是ResNet

ResNet(Residual Network,残差网络)是2015年由何凯明等人提出的深层卷积神经网络(CNN)架构,因解决了“深层网络训练难题”而成为计算机视觉领域的里程碑模型。它在ImageNet图像分类竞赛中以显著优势夺冠,并深刻影响了后续几乎所有深度学习视觉任务的模型设计。

核心问题:深层网络的“退化现象”

在ResNet提出前,研究者发现一个矛盾:当网络深度增加到一定程度后,模型性能会先提升、后下降(即使没有过拟合)。这种“深度增加但精度下降”的现象被称为“退化(Degradation)”,其本质是深层网络在反向传播时,梯度经过多层传递后会逐渐消失或爆炸,导致底层参数难以更新,模型无法有效学习。(但深度增加后,梯度∂Loss​∂x\frac{∂Loss​}{∂x}xLoss经多层传递后趋近于 0。)

ResNet的核心创新:残差块与跳跃连接

为解决退化问题,ResNet引入了残差块(Residual Block)结构,其核心是“跳跃连接(Skip Connection)”——让输入直接跳过部分网络层,与该部分的输出相加,形成“残差学习”机制。

1. 残差块的结构

一个基础残差块包含:

  • 若干卷积层(通常是2-3层),负责学习“残差函数”F(x)F(x)F(x)
  • 一条跳跃连接(通常是直接映射,即恒等映射),将输入xxx直接传递到块的输出端;
  • 输出为“残差函数 + 输入”:H(x)=F(x)+xH(x) = F(x) + xH(x)=F(x)+x

简单来说,传统网络要求卷积层直接学习目标映射H(x)H(x)H(x),而ResNet让卷积层学习“目标映射与输入的差值”(即残差F(x)=H(x)−xF(x) = H(x) - xF(x)=H(x)x),再通过跳跃连接将输入“加回来”。

2. 跳跃连接的作用
  • 缓解梯度消失:反向传播时,梯度可以通过跳跃连接直接传递到浅层(无需经过所有卷积层),避免梯度在深层传递中衰减至0;
  • 简化学习目标:残差F(x)F(x)F(x)通常比直接学习H(x)H(x)H(x)更容易(例如,当最优映射接近恒等映射时,F(x)F(x)F(x)只需学习接近0的小值);
  • 保留低层特征:输入xxx直接传递到深层,避免低层特征在多层变换中被“稀释”。

ResNet的典型结构

ResNet根据网络深度分为多个版本(如ResNet-18、34、50、101、152),数字代表总层数(含卷积层和全连接层)。其中:

  • 浅层ResNet(18/34层):使用“基础残差块”,由2个3×3卷积层组成;
  • 深层ResNet(50/101/152层):使用“瓶颈残差块(Bottleneck Block)”,通过1×1卷积先降维、再用3×3卷积计算、最后1×1卷积升维,在增加深度的同时减少参数和计算量。

整体结构遵循“卷积层 + 残差块堆叠 + 全局池化 + 全连接层”的范式,通过残差块的重复堆叠实现“超深”网络(最深达152层)。

ResNet的意义与影响

  1. 突破深度限制:首次实现了100层以上网络的有效训练,证明“更深的网络可以更优”;
  2. 成为基础架构:残差连接被广泛借鉴到后续模型中(如ResNeXt、DenseNet、Transformer等),成为深度学习的“标准组件”;
  3. 推动视觉任务发展:在图像分类、目标检测(如Faster R-CNN)、语义分割(如U-Net改进版)等任务中,基于ResNet的模型长期保持SOTA(State-of-the-Art)性能。

简言之,ResNet通过“残差学习”和“跳跃连接”解决了深层网络的训练难题,不仅刷新了当时的视觉任务精度,更重塑了深度学习模型的设计思路,至今仍是计算机视觉领域的基础模型之一。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1119591.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用鲸鱼优化算法优化LSTM模型参数

使用鲸鱼优化算法对LSTM的隐含层神经网络,学习率,训练次数三个参数进行寻优,WOA-LSTM模型的输入数据的自变量是多维即多列数据输入,输出的因变量单维即单列数据输出,代码内部有详细的注释,可学习性强&#…

供应链管理:术语、术语集合、术语汇总、pmbok第六版术语、pmbok第七版术语、jira术语、供应链术语、供应链系统、企业角色、岗位角色

一、PMBOK第六版术语 https://blog.csdn.net/snowball_li/article/details/152075536?spm1011.2415.3001.5331 二、PMBOK第七版术语 https://blog.csdn.net/snowball_li/article/details/152076878?spm1011.2415.3001.5331 三、敏捷 https://blog.csdn.net/snowball_li/…

似乎折腾NAS久了也会累。

最近小白想着再出点比较实用的教程,但是一打开NAS界面,突然感觉所有的力气都被抽走了。于是就有了今天的这篇文章:似乎折腾NAS久了也会累……(想要壁纸的小伙伴到公众号后台回复【壁纸】)都说成年人的三大爱好&#xf…

基于主从博弈的共享储能与综合能源微网优化运行探秘

基于主从博弈的共享储能与综合能源微网优化运行研究 综合能源微网与共享储能的结合具有一定的创新性,在共享储能的背景下考虑微网运营商与用户聚合商之间的博弈关系,微网的收益和用户的收益之间达到均衡。 采用主从博弈的方法,微网运营商作为…

S7 - 200 PLC实现4泵供水控制系统设计全解析

S7-200PLC程序4泵供水控制系统设计四泵供水控制系统 带解释的梯形图程序,接线图原理图图纸,io分配,组态画面在工业控制领域,稳定可靠的供水系统至关重要。今天咱们就来讲讲基于S7 - 200 PLC的4泵供水控制系统,从梯形图…

Android Jetpack Compose - Compose 重组、AlertDialog、LazyColumn、Column 与 Row

一、Compose 重组 1、基本介绍重组是 Compose 更新的唯一方式&#xff0c;当状态变化时&#xff0c;Compose 会重新执行受影响的 Composable 函数&#xff0c;生成新的 UI 描述MutableState<T> 是一个可观察的状态容器&#xff0c;它持有一个值&#xff0c;当这个值改变时…

深入 ‘Token Consumption Profiling’:在大规模图中精准定位哪一个‘思维步骤’最费钱?

深入 ‘Token Consumption Profiling’&#xff1a;在大规模图中精准定位哪一个‘思维步骤’最费钱&#xff1f;各位同仁&#xff0c;下午好&#xff01;今天我们的话题聚焦于一个在当前AI时代变得尤为关键的挑战&#xff1a;如何在与大规模图数据交互时&#xff0c;精准地识别…

基于SpringBoot的农产品溯源系统

背景分析农产品溯源系统的需求源于消费者对食品安全问题的日益关注。近年来&#xff0c;农药残留、假冒伪劣产品等问题频发&#xff0c;传统农业供应链信息不透明&#xff0c;导致消费者难以追溯农产品源头。政府出台《食品安全法》《农产品质量安全追溯管理办法》等政策&#…

从零开始学CTF:网络安全竞赛完全指南,建议收藏学习

从零开始学CTF&#xff1a;网络安全竞赛完全指南&#xff0c;建议收藏学习 文章全面介绍网络安全竞赛&#xff0c;重点解析CTF比赛的概念、规则和五大类别&#xff08;Web安全、逆向工程、二进制安全、密码学和隐写术&#xff09;&#xff0c;并对比了CTF比赛、信息安全比赛和…

从2025到2026:SUNX 合约交易所是如何一步步赢得用户信任的

从 2025 到 2026&#xff1a;我意识到 SUNX 真的不一样了如果你也是长期做合约、频繁交易 BTC、ETH 的老用户&#xff0c;大概都会有同样的感受&#xff1a;真正决定你把主账户放在哪家交易所的&#xff0c;从来不是广告&#xff0c;而是“用久了安不安心”。过去几年&#xff…

2025 网安工程师证怎么考?11 月考试 + 8 月报名,新考点(Prompt 注入 / SM4 算法)拆解!

网络信息安全工程师是一种专门从事网络安全工作的职业。随着互联网的快速发展和普及&#xff0c;网络安全问题也日益突出&#xff0c;因此网络信息安全工程师的需求也越来越大。 网络信息安全工程师主要负责保护网络系统和数据的安全&#xff0c;防止黑客攻击、病毒侵入、数据泄…

2026年焦虑是无法避免的

当潮水退去&#xff0c;我们才发现自己并非在裸泳&#xff0c;而是身处一片正在冰封的海域。2025年年末&#xff0c;有幸与几位业内公认的大神级人物小聚。推杯换盏间&#xff0c;聊的不再是前沿的技术趋势和激动人心的架构革新&#xff0c;反而弥漫着一种难以名状的沉重。一位…

什么是 ‘Latency Budgeting’:为图中每一个节点设置纳秒级的超时阈值,实现强制故障转移

欢迎来到本次关于分布式系统性能优化的深度探讨。今天&#xff0c;我们将聚焦一个关键且极具挑战性的概念——“Latency Budgeting”&#xff0c;特别是当我们将这一理念推向极致&#xff0c;为系统中的每一个节点设置纳秒级的超时阈值&#xff0c;以实现强制故障转移时。作为一…

【Mybatis 框架】SQL 注入判断技巧全解,零基础入门到精通,收藏这篇就够了!

Mybatis框架&#xff1f;老生常谈&#xff1f;不&#xff01; MyBatis&#xff0c;这玩意儿在Java圈子里谁还没听过&#xff1f;ORM框架嘛&#xff0c;把Java对象和数据库表里的数据对应起来&#xff0c;省得你写一堆JDBC代码。但它跟Hibernate那种“全自动”选手不一样&#…

为什么游戏需要“加载时间“?——从硬盘读取到内存渲染

&#x1f3ae; 为什么游戏需要"加载时间"&#xff1f;——从硬盘读取到内存渲染 &#x1f4be;大家好&#xff0c;我是无限大&#xff0c;欢迎收看十万个为什么系列文章 希望今天的内容能对大家有所帮助想象一下&#xff1a;你迫不及待地打开新买的3A大作&#xff0c…

C盘清理技巧分享大纲

C盘清理技巧分享大纲清理临时文件Windows系统自带的磁盘清理工具可以快速删除临时文件、下载缓存和系统日志。通过运行cleanmgr命令选择C盘进行扫描和清理。卸载不必要程序控制面板中的“程序和功能”可以查看已安装软件&#xff0c;卸载长时间未使用或冗余的应用程序。第三方工…

数字员工赋能AI销冠系统与AI提效软件系统提升企业运营效率

数字员工通过与AI销冠系统的协同工作&#xff0c;能够有效优化企业的业务流程。它们自动化处理重复性任务&#xff0c;使得企业在全天候内以更高效率与客户沟通&#xff0c;这不仅提升了客户体验&#xff0c;还降低了人工成本。此外&#xff0c;数字员工能够实时收集和分析客户…

Unity PicoVR开发 实时预览Unity场景 - 在Pico设备中

1、安装 PDC 工具 2、打开PDC工具&#xff0c;使用 PICO 开发者账号登录。 3、使用 USB 数据线 连接头显。若连接成功&#xff0c;如下图所示&#xff1a; 4、安装串流服务 5、为一体机开启 “开发者” 模式 步骤如下&#xff1a; 开启 PICO VR 一体机。前往 设置 > 通用 …

车间手机管理难题破解指南:从“一刀切禁止”到“数字化疏导”的科学决策

开篇&#xff1a;点出决策误区许多制造企业在管理车间手机使用时&#xff0c;常陷入“只堵不疏”的误区。数据显示&#xff0c;超过50%的企业在推行手机管控时&#xff0c;因 “手段粗暴引发抵触”、“缺乏替代方案降低效率” 或 “管理系统与生产实际脱节” 而导致政策流于形式…

网络进阶教程:节点小宝中心节点策略的反向使用方法!

最近有小伙伴咨询到小白&#xff1a;如果家里局域网里有一台24h开机状态的NAS&#xff0c;且在这台NAS上已经部署了节点小宝&#xff0c;现在有一台机器是在异地状态下也部署了节点小宝。问&#xff1a;家里局域网下的其他设备不安装节点小宝能否通过中心节点访问到异地的那台设…