吴恩达深度学习课程二: 改善深层神经网络 第一周:深度学习的实践(五)归一化

news/2025/11/3 13:34:29/文章来源:https://www.cnblogs.com/Goblinscholar/p/19186772

此分类用于记录吴恩达深度学习课程的学习笔记。
课程相关信息链接如下:

  1. 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai
  2. github课程资料,含课件与笔记:吴恩达深度学习教学资料
  3. 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案

本篇为第二课第一周的内容,1.9的内容。


本周为第二课的第一周内容,就像课题名称一样,本周更偏向于深度学习实践中出现的问题和概念,在有了第一课的机器学习和数学基础后,可以说,在理解上对本周的内容不会存在什么难度。

当然,我也会对一些新出现的概念补充一些基础内容来帮助理解,在有之前基础的情况下,按部就班即可对本周内容有较好的掌握。
在学习完一些缓解过拟合的方法后,我们便可以较好的训练神经网络,而不至于出现因为模型复杂度上升反而导致模型性能下降的情况
这样,神经网络就可以较好的拟合数据。
而这一部分的内容,就是在这个基础上如何加快神经网络的训练,实现更快,更稳定地收敛

1.归一化

还是先把概念摆出来:

归一化(Normalization)是指将数据按一定的比例或标准进行调整,使得数据的数值范围或分布符合某种特定的要求。通常,归一化的目标是将数据转化为统一的尺度,便于不同数据之间的比较或用于某些算法中。

要提前说明的是,下面的笔记内容介绍的只是归一化方法中最普适的一种,叫Z-Score标准化(标准差标准化),也可以直接叫标准化。

1.1 标准化的步骤

(1)计算样本的均值

对每一维特征,计算其均值 \(\mu\)

\[\mu = \frac{1}{N}\sum_{i=1}^{N} x_i \]

我们用一组数据在每一步进行相应处理来演示这个完整的过程:
原始样本:\([10, 12, 9, 15, 14]\),样本数 \(N=5\)

\[\mu = \frac{10 + 12 + 9 + 15 + 14}{5} = \frac{60}{5} = 12.0 \]

(2)计算每个样本与均值的差 \((x - \mu)\) 以及平方差

样本 \(x\) \(x - \mu\) \((x - \mu)^2\)
10 -2 4
12 0 0
9 -3 9
15 3 9
14 2 4

(3)计算方差与标准差

总体方差(分母使用 \(N\)):

\[\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i-\mu)^2 = \frac{26}{5} = 5.2 \]

总体标准差:

\[\sigma = \sqrt{\sigma^2} = \sqrt{5.2} \approx 2.280351 \]

(4)执行标准化变换

每个样本的标准化结果:

\[z = \frac{x - \mu}{\sigma} \]

逐项计算:

\(x\) \(x-\mu\) \(z = \frac{x-\mu}{\sigma}\)
10 -2 -0.877058
12 0 0.000000
9 -3 -1.315587
15 3 1.315587
14 2 0.877058

因此标准化后的结果为:

\[[-0.877058,\ 0.0,\ -1.315587,\ 1.315587,\ 0.877058] \]

这样,我们就对数据完成了一次标准化,那进行这些步骤的作用又是什么呢?

1.2标准化的作用

我们来看一下各个步骤后,样本数据的变化:
myplot213213

这是未经处理的原始数据,现在,我们按照标准化公式一步步进行:

\[z = \frac{x - \mu}{\sigma} \]

将各数据减去均值,这一步也叫做中心化,此时数据分布如下:
myplot3213123

可以发现,中心化后,数据的均值变为 0

\[ \frac{1}{N}\sum_{i=1}^{N} z_i = 0 \]

现在,我们再把中心化的数据除以标准差,此时数据分布如下:
44

经过这一步,标准化后数据的标准差为 1

\[\sqrt{\frac{1}{N}\sum_{i=1}^{N}(z_i - 0)^2} = 1 \]

也就是说,标准化后,数据的均值变为0,标准差变为1,这是它的作用,可这样的变换又是如何帮助训练的呢?
我们继续下一节。

1.3 标准化如何帮助训练?

(1)消除量纲差距的同时保持特征信息

在现实数据中,不同特征往往有不同的单位或数量级
例如,在一个房价预测模型中:

  • 房屋面积以“平方米”计,数值可能在几十到几百;
  • 房间数量只在“1~5”之间变化。
    如果不做标准化,面积特征的值远大于房间数,模型在更新参数时会更偏向面积,而忽视房间数量的影响。

对此,标准化这样解决这个问题:

  • 中心化:将每个特征的均值移动到 0,使数据以 0 为中心,正负对称,方便神经网络处理。
  • 除以标准差:标准差就像一个“伸缩尺”,根据特征自身的波动范围对数据进行拉伸或压缩,波动大的特征被压缩幅度大,波动小的特征被压缩幅度小,从而统一特征尺度。
    要说明的是,除以标准差精妙的地方在于统一尺度的同时保留了同一特征内的差距

举个例子:
对于两个人的年龄,一个人20岁,一个人10岁。
压缩后,前一个人变成了2岁,后一个人变成了1岁。
但是他们之间的差别关系没有变化,前者仍比后者大,我们只是把跨度从10岁缩小从了1岁来减少波动性。模型依旧可以区分两个样本的差别。

我们再用房屋的实例说明来整体演示一下:

  1. 设房屋面积原始值:[50, 120, 200, 300, 400], 房间数原始值:[1, 2, 3, 4, 5]
  2. 中心化后:面积:[−167, −97, −17, 83, 183],房间数:[−2, −1, 0, 1, 2]
  3. 除以标准差(面积 σ≈145.44,房间数 σ≈1.414)后: 面积标准化:[−1.15, −0.67, −0.12, 0.57, 1.26], 房间数标准化:[−1.41, −0.71, 0, 0.71, 1.41]
    这样,通过标准化,面积和房间数都被缩放到大致相似的范围,梯度更新时影响力平衡,同时保持了各房屋之间的相对差异。
    可以形象地理解为:每个特征都被配上了“统一的尺子”,让它们在同一尺度下公平竞争,既消除了量纲差距,又保持原始信息。

(2)平衡含正负值的数据集

标准化后的数据以 0 为中心,分布更对称,特别适合使用如 tanh、ReLU 等激活函数的神经网络。
我们用tanh举例:
myplot2

如果输入特征全是正数,tanh 的输出始终偏向 1 区域,梯度几乎为 0,学习停滞。
而经过标准化后,输入既有正又有负,输出能覆盖整个区间,梯度保持活跃,网络学习更充分。

这便是关于归一化的内容,下一篇便是本周理论部分的最后一篇,是关于网络运行中一些常见的梯度现象和其应对方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/954481.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025年11月市场地位认证机构排行解析:专业认证服务深度评测

在当今竞争激烈的市场环境中,企业越来越需要通过权威认证来证明自身的市场地位和品牌价值。作为企业决策者或品牌负责人,您可能正在寻找专业的市场地位认证机构,希望通过第三方权威认证提升品牌公信力、增强市场竞争…

2025年10月深圳刑事律师推荐排行:五家真实团队的可验证指标全解析

一、引言 在深圳这样经济活跃、案件类型多元的超大城市,刑事辩护早已不是“走流程”而是“拼细节”。创业者、企业高管、普通市民一旦卷入刑事案件,最紧迫的需求是快速锁定一位既懂程序漏洞又能把辩护词落到实处的律…

2025年项目管理软件排行榜前五!从需求到交付你怎么选? - RAIN

2025年项目管理软件排行榜前五!从需求到交付你怎么选?面对市场上琳琅满目的项目管理工具,你是否也在思考:哪一款真正能打通从需求提出到项目交付的全链路?哪一款不仅提升效率,更能驱动业务创新? 是选择功能堆砌…

2025年11月市场地位认证机构排名榜:服务维度与行业口碑全面解析

在市场竞争日益激烈的环境下,企业需要通过权威认证来证明自身的市场地位,以提升品牌公信力、增强消费者信任并优化商业合作机会。选择一家可靠的市场地位认证机构,成为许多企业管理者、品牌负责人或市场部门的核心需…

2025年11月办公家具公司排名榜单:从资质到服务的全面解析

作为企业管理者或行政负责人,选择办公家具公司常面临诸多挑战。无论是初创团队需要低成本快速配置办公空间,还是成熟企业追求高端定制化方案,办公家具的采购直接关系到员工工作效率、企业形象展示以及长期使用成本。…

学习一下压测和监控

初步学习压测和监控 本文示例代码以及数据库sql文件见:gitee https://gitee.com/quercus-sp204/new-technology/tree/master/all-component-monitor 1.环境说明首先是开发环境:jdk是21,然后maven是3.9.6,idea是202…

2025年11月办公家具公司推荐榜单:权威评测与综合对比分析

随着企业办公环境升级需求日益增长,选择一家可靠的办公家具公司成为许多企业管理者关注的重点。无论是初创团队寻求高性价比方案,还是成熟企业需要定制化高端配置,办公家具采购都关系到员工工作效率、企业形象展示和…

Spring IOC 容器和依赖注入(DI)

1、什么是 IOC? IOC(Inversion of Control)控制反转,IOC的核心是将对象的创建和依赖关系的组装控制权从程序内部反转到外部容器。容器管理的是Bean的生命周期和依赖关系,而“对象之间的调用过程”通常是由业务逻辑…

CSP-S 2025 赛时总结

T1 花了约 40min,小失误。 看到题目第一眼没有想到贪心,是 dp。 好在最后想到了反悔贪心,及时止损。 T2 2h......,超级失误。 首先想了好久才想到可以先做一次 Kr 将 \(m\) 去掉。 然后想到很久没有前途的直接枚举…

MATLAB2025b安装教程

MATLAB是一款高级技术计算语言、交互式算法开发环境和现代数据分析工具,作为数学类科技应用软件中首屈一指的软件,非常适合用于机器学习、信号处理、控制设计、图像处理、通信、计算机视觉、计算金融以及机器人技术等…

2025年11月领先品牌认证机构排行榜:权威评测与选择指南

在当今竞争激烈的市场环境中,企业越来越需要通过权威认证来证明自身的市场地位和品牌价值。作为企业决策者,您可能正在寻找一家可靠的领先品牌认证机构,以提升品牌公信力、增强市场竞争力。这种需求通常出现在企业准…

leaflow部署openlist

很久之前就想写这个教程,但怕过于简单,但是看见群内有佬友部署openlist遇到权限的问题,所以写下了这个话题。 按着图片操作即可,选择完全模式,主要看init容器部分。 cpu和内存我分配的比较少,主打一个省钱。 如下…

2025年11月上海婚姻律师服务评测:行业标准与用户反馈全解析

在上海这座国际化大都市中,婚姻家庭关系的稳定对社会和谐具有重要意义。根据最新发布的婚姻家事法律服务行业白皮书显示,随着社会结构变化和民众法律意识提升,上海地区婚姻家事案件年增长率持续保持在10%以上。选择…

Comparable接口

1. Comparable接口概述 1.1 基本概念包位置: java.lang.Comparable 功能: 定义对象的自然排序规则 核心方法: compareTo(T o) 用途: 让对象支持排序操作(Arrays.sort、Collections.sort等)1.2 接口定义 public inter…

软件授权安全:如何筑牢防护壁垒

在当今数字化时代,软件授权安全是每个开发者都必须面对的重要问题。软件一旦被破解,不仅会导致经济损失,还可能损害品牌形象。本文将深入探讨软件授权的安全问题,并提供一些实用的防护策略,帮助开发者构建更加安全…

WinMTR Json版:支持 JSON 配置的内网路径追踪工具

WinMTR Json版:支持 JSON 配置的内网路径追踪工具🚀 软件特性开源可信赖,基于原生 WinMTR 改造 支持加载自定义 JSON 配置文件,无需 qqwry.dat 可显示主机名、管理 IP 及多个关联 IP 支持ipv4和ipv6📌 使用说明…

2025年11月遗嘱继承律所评价:多维数据与行业标准解析

随着社会财富积累和家庭结构多元化,遗嘱继承规划逐渐成为现代家庭关注的焦点。许多中老年人在面临财产分配时,往往因缺乏专业法律知识而陷入困惑;年轻家庭则为规避未来潜在纠纷,开始提前布局遗产传承方案。根据中国…

2025年11月遗嘱继承律所评测排行:专业能力客观评估

在人生的财富传承规划中,遗嘱继承是确保个人意愿得以实现、家庭和谐得以维系的重要法律保障。随着社会财富积累和人口老龄化趋势加剧,遗嘱继承法律服务需求呈现显著增长态势。根据司法部近年发布的律师行业年度报告数…

Java 时间日期类笔记

1. 核心时间日期API发展历程 1.1 各版本主要APIJava 8之前: Date、Calendar、SimpleDateFormat Java 8+: java.time包 (JSR-310) 推荐: 新项目统一使用java.time包2. Java 8+ 时间日期API (java.time) 2.1 核心类概览类…

Day11伪类选择器

<!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0">…