误差反向传播法(链式法则)

链式法则

前面介绍的计算图的正向传播将计算结果正向(从左到右)传递,其计
算过程是我们日常接触的计算过程,所以感觉上可能比较自然。而反向传播将局部导数向正方向的反方向(从右到左)传递,一开始可能会让人感到困惑。
传递这个局部导数的原理,是基于链式法则(chain rule)的。本节将介绍链
式法则,并阐明它是如何对应计算图上的反向传播的。

计算图的反向传播

话不多说,让我们先来看一个使用计算图的反向传播的例子。假设存在
y = f(x) 的计算,这个计算的反向传播如图5-6 所示。

如图所示,反向传播的计算顺序是,将信号E乘以节点的局部导数
(∂y∂x)\left( \frac{\partial y}{\partial x} \right)(xy),然后将结果传递给下一个节点。这里所说的局部导数是指正向传播
y=f(x)y = f(x)y=f(x)的导数,也就是y 关于x的导数( )。比如,假设y=f(x)=x2y = f(x) = x^2y=f(x)=x2
则局部导数为∂y∂x=2x\frac{\partial y}{\partial x} = 2xxy=2x。把这个局部导数乘以上游传过来的值(本例中为E),
然后传递给前面的节点。

这就是反向传播的计算顺序。通过这样的计算,可以高效地求出导数的
值,这是反向传播的要点。那么这是如何实现的呢?我们可以从链式法则的
原理进行解释。下面我们就来介绍链式法则。

什么是链式法则

介绍链式法则时,我们需要先从复合函数说起。复合函数是由多个函数
构成的函数。比如,z=(x+y)2z = (x + y)^2z=(x+y)2是由式(5.1)所示的两个式子构成的。
z=t2 z = t^2z=t2
t=x+y t = x + yt=x+y

链式法则是关于复合函数的导数的性质,定义如下。

如果某个函数由复合函数表示,则该复合函数的导数可以用构成复
合函数的各个函数的导数的乘积表示。

这就是链式法则的原理,乍一看可能比较难理解,但实际上它是一个
非常简单的性质。以式(5.1)为例,∂z∂x\frac{\partial z}{\partial x}xz(z 关于x 的导数)可以用∂z∂t\frac{\partial z}{\partial t}tz(z 关于t
的导数)和∂t∂x\frac{\partial t}{\partial x}xt(t 关于x的导数)的乘积表示。用数学式表示的话,可以写成
式(5.2)。
∂z∂x=∂z∂t⋅∂t∂x \frac{\partial z}{\partial x} = \frac{\partial z}{\partial t} \cdot \frac{\partial t}{\partial x}xz=tzxt

式(5.2)中的∂t∂ tt正好可以像下面这样“互相抵消”,所以记起来很简单。

∂z∂x=∂z∂t⋅∂t∂x \frac{\partial z}{\partial x} = \frac{\partial z}{\partial t} \cdot \frac{\partial t}{\partial x}xz=tzxt

现在我们使用链式法则,试着求式(5.2)的导数∂z∂x\frac{\partial z}{\partial x}xz。为此,我们要先求
式(5.1)中的局部导数(偏导数)。
∂z∂t=2t \frac{\partial z}{\partial t} = 2ttz=2t
∂t∂x=1 \frac{\partial t}{\partial x} = 1xt=1

如式(5.3)所示,∂z∂x\frac{\partial z}{\partial x}xz等于2t,∂t∂x\frac{\partial t}{\partial x}xt等于1。这是基于导数公式的解析解。
然后,最后要计算的∂z∂x\frac{\partial z}{\partial x}xz可由式(5.3)求得的导数的乘积计算出来。

链式法则和计算图

现在我们尝试将式(5.4)的链式法则的计算用计算图表示出来。如果用
“**2”节点表示平方运算的话,则计算图如图5-7 所示。

如图所示,计算图的反向传播从右到左传播信号。反向传播的计算顺序
是,先将节点的输入信号乘以节点的局部导数(偏导数),然后再传递给下一
个节点。比如,反向传播时,“**2”节点的输入是∂z∂x\frac{\partial z}{\partial x}xz,将其乘以局部导数∂z∂t\frac{\partial z}{\partial t}tz(因
为正向传播时输入是t、输出是z,所以这个节点的局部导数是∂z∂t\frac{\partial z}{\partial t}tz),然后传
递给下一个节点。另外,图5-7 中反向传播最开始的信号∂z∂z\frac{\partial z}{\partial z}zz在前面的数学
式中没有出现,这是因为∂z∂z=1\frac{\partial z}{\partial z}=1zz=1,所以在刚才的式子中被省略了。

图5-7 中需要注意的是最左边的反向传播的结果。根据链式法则,
$
\frac{\partial z}{\partial z} \cdot \frac{\partial z}{\partial t} \cdot \frac{\partial t}{\partial x} = \frac{\partial z}{\partial t} \cdot \frac{\partial t}{\partial x} = \frac{\partial z}{\partial x}
$
成立,对应“z 关于x的导数”。也就是说,反向传播
是基于链式法则的。

把式(5.3)的结果代入到图5-7 中,结果如图5-8 所示,∂z∂t\frac{\partial z}{\partial t}tz的结果为
2(x+y)2(x + y)2(x+y)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1183972.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026企业认证体系迎大洗牌:Net-NTLMv1彩虹表数据库 敲响NTLMv1丧钟

2026年1月15日,谷歌旗下网络安全巨头Mandiant的一则公告,在全球网络安全圈掀起轩然大波——其正式发布了一套完整的Net-NTLMv1彩虹表数据库,将这一存续近40年的老旧认证协议推向淘汰边缘。这套托管于Google Cloud、总容量达数百GB的工具集&am…

李飞飞的World Labs联手光轮智能,具身智能进入评测驱动时代!

具身智能生态中最受关注的两家公司双刃合璧,原因无他,正是瞄准困扰行业已久的「规模化评测」问题,发起一波攻势。最火世界模型,最火具身智能基建,联手了!前者,是李飞飞旗下的World Labs&#xf…

【tensorRT从零起步高性能部署】22-TensorRT基础-模型推理动态shape

一、前言:为什么需要动态Shape? 你复习的TensorRT课程里讲动态Shape,核心解决的是「模型推理时输入尺寸不固定」的问题: 静态Shape:模型编译后输入尺寸固定(比如只能处理3x3的图片),…

反向传播为何如此高效?解锁其核心引擎:链式法则

反向传播为何如此高效?解锁其核心引擎:链式法则 一、从计算图的反向传播说起 我们先来看一个最简单的例子。假设有一个计算:y f(x),它的反向传播过程如下图所示:关键点: 反向传播时,信号&#…

内网凭据挖掘技术深度揭秘:从终端渗透到网络服务的企业防线突破全链路解析

在数字化转型加速推进的当下,企业内网承载着核心业务数据、知识产权与商业机密,成为网络攻击的“必争之地”。而凭据挖掘,作为攻击者实现内网横向移动、权限提升与持久化控制的“核心武器”,其技术手段正随着企业防御体系的升级不…

这家西方开源大模型公司,开源出了DeepSeek-V3背后的架构!头部模型表现都差不多了,Mistral CEO自曝如何赚钱

如果各家前沿模型的性能已经非常接近,几乎难以分出谁更强——那会发生什么?面对《the Big Technology Podcast》抛出的问题,Mistral AI的 CEO Arthur Mensch 表示:大模型肯定会走向商品化,当模型表现越来越接近&#x…

【普中STM32F1xx开发攻略--标准库版】-- 第 29 章 内部温度传感器实验

(1)实验平台:普中STM32F103朱雀、玄武开发板 上一章我们介绍了 ADC 模数转换实验, 知道 ADC 内部有一个通道连接着芯片的温度传感器, 这一章我们就来学习下 STM32F1 的内部温度传感器。 本章要实现的功能是: 通过芯片内部温度传感…

2026开年炸雷!Apache Kafka三重高危漏洞肆虐:RCE+DoS+SSRF齐发,波及2.0.0-3.9.0全版本,企业升级刻不容缓

一、漏洞背景与披露全景 2026年初,Apache软件基金会通过官方安全通报渠道,紧急披露了影响Kafka核心组件的3个高危安全漏洞,分别编号为CVE-2025-27817、CVE-2025-27818、CVE-2025-27819。这批漏洞由全球多个安全团队协同发现,其中C…

方程豹豹8开启智驾撞牛未停车 车主质疑:智驾有什么用呢?

【文/深度评车&财经三剑客】1月12日,济南的潘先生反映2025年6月购买了一辆方程豹豹8,12月在内蒙古使用智能辅助驾驶时,侧面撞到牛身上。车辆提醒、躲闪及制动功能都没有启动,4S店表示:强光照射激光雷达导致短暂“失…

手搓HTML解析器:500行代码实现完整的DOM树构建

手搓HTML解析器:500行代码实现完整的DOM树构建引言:为什么需要理解HTML解析器?在Web开发中,DOM(文档对象模型)是我们与网页交互的核心接口。现代前端框架如React、Vue都构建在DOM之上,但很少有人…

三招速查本机端口占用

1.如何查看本机端口占用 查看本机端口占用情况是网络调试、服务部署和故障排查的常见需求。不同操作系统提供了不同的命令行工具,以下是 Windows、Linux、macOS 三大平台的详细方法: ✅ 一、通用原理 操作系统内核维护一张 “网络连接与监听表”&#…

护照阅读器:爱达魔都号邮轮的高效登船助力

爱达魔都号作为连接多国航线的邮轮,登船环节需完成旅客身份核验与出入境合规检查,护照阅读器的应用让这一流程更顺畅高效。根据邮轮出行的证件管理要求,旅客需凭有效护照及相关凭证登船,且护照需满足有效期等规范。以往人工核对护…

【读书笔记】《日常生活中的自我呈现》

《日常生活中的自我呈现》书籍解读整理 这是一本由加拿大社会学家欧文戈夫曼(Erving Goffman)撰写的经典著作,将戏剧表演框架引入社会学分析,提出“拟剧论”(dramaturgical analysis)。戈夫曼认为&#xff…

小程序毕设项目推荐-基于微信小程序的文化娱乐购票系统基于springboot+微信小程序的话剧票务管理系统【附源码+文档,调试定制服务】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

马斯克狂砸16亿「买」他五年!揭秘特斯拉2号人物,那个睡工厂的狠人

没有家庭、没有房子,只有一个使命——这就是朱晓彤。获授52万期权,他需坚守5年,完成累计2000万辆交付等KPI。最近,特斯拉向美国证券交易委员披露了一项重磅股权激励:授予全球汽车业务高级副总裁朱晓彤(Tom …

【读书笔记】《傅雷家书》

《傅雷家书》精讲整理 《傅雷家书》是一本经典之作,记录了著名翻译家、文艺评论家傅雷与儿子、钢琴家傅聪之间长达十二年的书信往来。这些家书不仅是父子深情的真实流露,更是家庭教育、亲子关系、艺术修养与人生智慧的宝贵结晶。以下是对分享内容的系统整…

R8240数字电子计

R8240 数字电子计R8240 是一款高精度数字电子计,用于工业和实验环境中对电量、时间或其他参数进行精确测量和显示。它以可靠性高、操作简便和读数直观而著称。主要特点与应用:高精度测量:提供稳定、准确的数字读数,满足工业及科研…

双目摄像头:让人脸登录更安全可靠

人脸登录因无需密码、操作便捷,已广泛应用于手机解锁、APP登录等场景,但单目摄像头易被照片、视频等虚假手段破解,存在安全隐患。双目摄像头的出现,为解决这一问题提供了有效方案。 双目摄像头模拟人眼“双眼视物”的原理&#xf…

纽约时报:OpenAI或将在18个月内现金流枯竭

奥特曼的万亿豪赌或难以为继,OpenAI 恐面临被吞并结局,AI 泡沫时代即将硬着陆。 华尔街最近弥漫着一种「恐高症」。 AI 概念股已经涨到了让人眩晕的高度,似乎只要技术稍不达预期,崩盘就在眼前。 市值最高的 7 大科技巨头&#x…

手机也能跑AI?用DeepSeek-R1-Distill-Qwen-1.5B打造边缘计算助手

手机也能跑AI?用DeepSeek-R1-Distill-Qwen-1.5B打造边缘计算助手 1. 引言:当大模型走向终端设备 近年来,AI大模型的发展速度令人瞩目。从千亿参数的GPT系列到如今轻量级但性能强劲的小模型,边缘AI推理正成为技术演进的重要方向。…