梯度检查

news/2025/11/12 15:23:24/文章来源:https://www.cnblogs.com/guxuanqing/p/19214184
梯度检查(Gradient Checking)中使用的双边逼近(Two-sided Approximation)方法,也称为中心差分法(Central Difference Method)。
梯度检查的目的
在深度学习中,我们使用反向传播算法(Backpropagation)来计算损失函数关于模型参数的梯度。然而,反向传播的实现复杂,容易出错。
梯度检查是一种数值方法,用于验证反向传播计算出的解析梯度(Analytical Gradient)是否正确。它通过使用函数值的微小变化来数值逼近梯度。
 

image

 

为什么双边逼近更好? 
双边逼近的主要优势在于其更高的准确性 
  • 误差更小:双边逼近的误差项是
    O(ϵ2)cap O open paren epsilon squared close paren
    𝑂(𝜖2)
    级别的(与
    ϵepsilon
    𝜖
    的平方成正比)。这意味着,如果
    ϵepsilon
    𝜖
    很小,双边逼近的误差比单边逼近小得多。
    • 例如,如果
      ϵ=0.01epsilon equals 0.01
      𝜖=0.01
      ,单边误差约为
      0.010.01
      0.01
      ,而双边误差约为
      0.00010.0001
      0.0001
  • 对称性:它在
    θtheta
    𝜃
    点周围对称地采样,更好地捕捉了该点的局部斜率。 
梯度检查的实现步骤 
在实际应用中,梯度检查涉及将解析梯度与数值梯度进行比较: 
  1. 计算解析梯度:使用反向传播算法计算模型的梯度
    ganalyticg sub analytic end-sub
    𝑔analytic
  2. 计算数值梯度:对模型的每个参数
    θitheta sub i
    𝜃𝑖
    ,使用双边逼近公式计算其数值梯度
    gnumeric,ig sub numeric comma i end-sub
    𝑔numeric,𝑖
  3. 比较:计算解析梯度和数值梯度之间的相对差(Relative Difference) 
Relative Difference=|ganalytic−gnumeric||ganalytic|+|gnumeric|Relative Difference equals the fraction with numerator the absolute value of g sub analytic end-sub minus g sub numeric end-sub end-absolute-value and denominator the absolute value of g sub analytic end-sub end-absolute-value plus the absolute value of g sub numeric end-sub end-absolute-value end-fraction
RelativeDifference=|𝑔analytic−𝑔numeric||𝑔analytic|+|𝑔numeric|
  1. 判断
    • 如果相对差小于
      10-710 to the negative 7 power
      10−7
      10-810 to the negative 8 power
      10−8
      ,说明反向传播的实现很可能是正确的。
    • 如果相对差大于
      10-510 to the negative 5 power
      10−5
      ,通常意味着你的反向传播实现可能存在错误(Bug)。
 
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/963477.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

荆门定制西林瓶灌装机费用解析,比标准款贵多少?

在荆门地区,随着生物医药、诊断试剂及营养液等细分行业的快速发展,对西林瓶灌装设备的需求日益增长。然而,不少企业在选购定制化西林瓶灌装机时,常因缺乏专业指导而陷入“参数陷阱”或“功能冗余”误区。据行业调研…

甘孜西林瓶灌装压塞机安装调试指南及周期解析

在甘孜地区,随着制药及生物制剂产业的稳步发展,对西林瓶灌装设备的需求持续增长。用户普遍关心的问题之一是:西林瓶灌装压塞机的安装调试是否由厂家负责?安装周期通常需要多久?针对此类问题,业内通行做法是由设备…

Day19综合案例一

<!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0">…

P13508 [OOI 2024] Burenka and Pether

对于任意一个点 \(i\),\(i\) 能直接到达的点 \(p\) 需要 \(a_p\ge a_i\),且 \(p\le r_i\),其中 \(r_i\) 是 \(i\) 能到的最后一个 \(<a_i\) 的位置 \(+d\)。\(r_i\) 可以按值域扫描线预处理。 对于 \(a_{v_i}\) …

常见的无状态服务与典型有状态服务

常见的无状态服务与典型有状态服务要区分无状态服务和有状态服务,核心标准是:无状态服务:不存储业务数据,每次请求独立(输入相同则输出相同),可随意扩容 / 迁移,依赖外部存储(如数据库、缓存)保存状态; 有状…

CF1720D2 Xor-Subsequence (hard version)

这个题无论是 D1 还是 D2 都很具有思维含量。 首先考虑 \(a_i \le 200\) 怎么做。 考虑异或有性质 \(|a - b| \le a \oplus b \le a + b\),那么推一下就会知道目前 \(j\) 一定 \(\ge i - 400\),暴力枚举即可。 然后思…

如何实现大模型和本企业内部知识相结合形成一个适合本企业的小模型

将大模型与企业内部知识结合,构建适合本企业的“小模型”或增强型应用,核心目标是让通用大模型具备企业专属的知识、语言风格和业务逻辑,同时避免从零训练大模型的高成本和高门槛。以下是具体实现路径和关键步骤: …

etcd的压缩和碎片整理提升性能

压缩+碎片整理(逐节点执行,先压缩后整理,避免并发)bash 复制for ep in ${ENDPOINTS//,/ }; doecho "==> working on $ep"# 取得当前 revisionREV=$(etcdctl --endpoints=$ep endpoint status --write…

Maven 继承的“隐形杀手”:被你忽略的 relativePath

在日常的 Maven 多模块项目开发中,我们对 <parent> 标签带来的继承便利习以为常。但在这个便利之下,隐藏着一个微小却极易被忽视的配置:<relativePath>。 你是否遇到过这样的“灵异事件”:在 IDEA 中,…

【SPIE出版 | 往届会后3个月完成EI检索】第二届遥感与数字地球国际学术会议 (RSDE 2025)

2025年第二届遥感与数字地球国际学术会议(RSDE 2025)定于2025年11月14-16日在云南大理隆重举行。【高录用稳检索 | 往届会后3个月完成EI检索】 【团队报名享优惠 | 参会方式:口头汇报、海报展示、仅参会】 第二届遥…

基础模型+场景微调

“基础模型 + 场景微调”是目前性价比最高、最主流的企业级AI落地方式。它的核心思想是:站在巨人的肩膀上,不重复造轮子。 下面我将为你详细拆解这个过程,并结合一个具体的例子来说明。 核心概念解析基础模型 (Foun…

血月奇观科学解码:当“红月亮”邂逅古今文明,一场跨越千年的宇宙浪漫

2025年的血月有点不一般!图源澎湃新闻尽管 2025 年 9 月 8 日那场震撼的 “血月” 奇观已在夜空落幕,但它背后的科学奥秘与文化意涵仍值得我们回溯解析。根据中国科学院紫金山天文台的观测记录,此次月全食的本影食从…

使用产品密钥升级Windows 11专业版及Windows 11专业工作站版

Win11 专业版:面向个人与中小企业用户,提供BitLocker磁盘加密、远程桌面连接、组策略管理、域加入等高级功能,支持安全高效的办公与系统管理,满足日常专业需求。 Windows 11 专业版 密钥 Win11 专业工作站版:专为…

局域网扫码枪/局域网二维码接收工具

局域网扫码枪/局域网二维码接收工具扫码枪在识别印刷于芯片表面的二维码时,存在识别效率较低、准确率不高的问题。 相比之下,手机摄像头性能更强,结合微信扫码功能,识别速度更快、准确度更高。 因此,考虑通过微信…

Rust:关于Future和JoinHanlder的思考

Future和JoinHandler是不同的,但这两个都与异步(多线程)相关。 概念不同JoinHandler:是指一个异步方法的句柄,用来监控或控制这个异步方法,以及接收异步方法的执行结果。 Future:表示的是在未来某个时刻执行的代…

2025年衣柜顶线定做厂家权威推荐榜单:石膏顶线/欧式顶线/脚线源头厂家精选

一樘精美的衣柜,少不了那画龙点睛的顶线。它不仅是缝隙的遮蔽者,更是空间风格的塑造者。 在当今家居装修市场,全屋定制的渗透率正持续提升,消费者对细节装饰的需求也日益精细化。作为连接衣柜与天花的关键元素,衣…

完整教程:AI编程工具(Cursor/Copilot/灵码/文心一言/Claude Code/Trae)AI编程辅助工具全方位比较

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

【IEEE出版 | 连续4年稳定EI检索】第五届新能源与电力工程国际学术会议(ICNEPE 2025)

第五届新能源与电力工程国际学术会议(ICNEPE 2025)将于2025年11月14日至16日在中国广州隆重举行。【连续4年稳定EI检索,发表有保障!】 【院士、Fellow出席报告,行业内精彩报告!EI期刊和EI会议检索同时征稿】 第五…

习题解析之:计算圆周率——拉马努金法

习题解析之:计算圆周率——拉马努金法【问题描述】编写一个拉马努金公式计算圆周率大小的小程序。 拉马努金曾经提出过很多关于求π的公式,这些公式都有以下几个特点: 等号右边的构造超乎常人想象,收敛速度极快! …

【刷题笔记】Placing Squares

Placing Squares 题解 拍死脑袋也想不出来啊。 敲黑板: \(x^2\) 的组合意义,就是在一个长为 \(x\) 的区间内放小球(一个黑色,一个白色,可以重叠)的方案数。 这样题目就转化为了在一个序列内插板,每两个板之间放…