【小白也能懂】PyTorch 里的 0.5 到底是干啥的?——一次把 Normalize 讲透! - 教程

news/2025/9/19 18:25:32/文章来源:https://www.cnblogs.com/yfceshi/p/19101476

开场 3 秒

“我只是想把灰度图丢进神经网络,结果教程里突然冒出两行代码:
transforms.ToTensor(),
transforms.Normalize((0.5,), (0.5,))
——这俩 0.5 是干嘛的?能不能不写?”
如果你有同样的灵魂发问,今天 5 分钟,咱们把它聊成大白话。


一、ToTensor 先把图像“压扁”成 0~1

  1. 照片在电脑里其实是 0~255 的整数。
  2. ToTensor() 一做除法:像素值 ÷ 255,全部变成 0~1 之间的小数。
  3. 对灰度图来说,最后得到的是一个 1×H×W 的张量,数值范围 [0, 1]。

二、Normalize 再把 0~1 变成“标准身材”

  1. 神经网络喜欢“均值为 0、方差为 1”的数据,训练更稳、收敛更快。
  2. Normalize 的公式就一句:
    output = (input – mean) ÷ std
  3. 灰度图只有一个通道,所以只传一个数:
    transforms.Normalize(mean=(0.5,), std=(0.5,))
    含义:
    mean=0.5 → 把刚才的 0~1 数据减去 0.5,中心移到 -0.5~0.5
    std =0.5 → 再除以 0.5,范围放大到 -1~1
    整幅图被“拍扁”到以 0 为中心、左右对称的 [-1, 1] 区间。就是于

三、为什么偏偏选 0.5,不选 0.3 或 0.8?

  1. 0~1 的中点,减完刚好对称。就是简单粗暴:0.5
  2. 除 0.5 相当于乘 2,口算就能想到范围变成 -1~1,不用查表。
  3. 对灰度图来说,这个“(-1,1)”区间足够让大多数 CNN 开心,且不容易饱和(掉进梯度消失区)。
  4. 不是玄学,也不是银弹——只是“经验值 + 计算方便”。要是材料集整体偏暗/偏亮,完全可以自己统计 mean/std 再替换。

四、彩色图怎么玩?

彩色图有 RGB 三个通道,就要给三个数:
transforms.Normalize(mean=(0.5, 0.5, 0.5),
std =(0.5, 0.5, 0.5))
原理一模一样:每个通道分别 (x-0.5)/0.5,最终全部落到 [-1,1]。


五、不写 Normalize 行不行?

行,但:

  1. 输入范围 0~1 时,ReLU 输出全正,后续层容易“偏移”到正区间,收敛慢。
  2. BatchNorm 层会帮你再归一化一次,可那得等网络自己学,训练初期波动大。
  3. 统一先归一化到 [-1,1],相当于给模型“提前铺好铁轨”,省事又稳。

六、总结(建议收藏)

[0,255] 原图
↓ ToTensor ÷255
[0,1] 浮点张量
↓ Normalize (0.5, 0.5)
(x-0.5)/0.5
[-1,1] 模型最爱


七、动手实验 30 秒

把下面代码粘进 Jupyter,打印前后数值,肉眼可见变化:

from torchvision import transforms
from PIL import Image
import torch
img = Image.open('test_gray.jpg').convert('L')
trans = transforms.Compose([
transforms.ToTensor(),
transforms.Normalize((0.5,), (0.5,))
])
t = trans(img)
print('最小值:', t.min(), '最大值:', t.max())

运行结果:最小值 ≈ -1,最大值 ≈ 1,目标达成!


八、常见小白 Q&A

Q1: 减 0.5 后像素变成负数,网络不会“懵”吗?
A: 不会。神经网络的权重可正可负,负数一样能乘,反而零均值能让梯度对称更新。

Q2: 我想把范围搞到 0~1,又不想负值怎么办?
A: 把 mean=0, std=1 就相当于不做 Normalize;或者直接用 ToTensor() 后不再归一化即可。

Q3: 均值和标准差必须自己算吗?
A: 生产环境最好跑一遍数据集统计真实 mean/std(PyTorch 官方脚本有),但 0.5/0.5 在大多数视觉任务里已“够用”。


结尾彩蛋

“0.5 不是魔法,只是让像素值从 0~1 搬家到 -1~1 的搬家公司。”
下次再见到这行代码,希望能会心一笑:
“哦,就是先减一半,再放大两倍,走了!”

要是这篇小文帮你扫清盲区,记得点个“赞”和“在看”,转给同样被 0.5 吓到的小伙伴吧~

(完)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/908000.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第58天:RCE代码amp;命令执行amp;过滤绕过amp;异或无字符amp;无回显方案amp;黑白盒挖掘

第58天:RCE代码&命令执行&过滤绕过&异或无字符&无回显方案&黑白盒挖掘 案例演示RCE & 代码执行 & 命令执行 RCE-利用&绕过&异或&回显 白盒-CTF-RCE代码命令执行 黑盒-运行-R…

057-Web攻防-SSRFDemo源码Gopher项目等

057-Web攻防-SSRF&Demo源码&Gopher项目等 知识点知识点: 1、SSRF-原理-外部资源加载 2、SSRF-利用-伪协议&无回显 3、SSRF-挖掘-业务功能&URL参数案例演示1、SSRF-原理&挖掘&利用&修复 2…

060-WEB攻防-PHP反序列化POP链构造魔术方法流程漏洞触发条件属性修改

060-WEB攻防-PHP反序列化&POP链构造&魔术方法流程&漏洞触发条件&属性修改 知识点: 1、PHP-反序列化-应用&识别&函数 2、PHP-反序列化-魔术方法&触发规则 3、PHP-反序列化-联合漏洞&P…

059-Web攻防-XXE安全DTD实体复现源码等

059-Web攻防-XXE安全&DTD实体&复现源码等 知识点 XML&XXE-传输-原理&探针&利用&玩法 XML&XXE-黑盒-JS&黑盒测试&类型修改 XML&XXE-白盒-CMS&PHPSHE&无回显什么是XML?…

061-WEB攻防-PHP反序列化原生类TIPSCVE绕过漏洞属性类型特征

061-WEB攻防-PHP反序列化&原生类TIPS&CVE绕过漏洞&属性类型特征知识点 1、PHP-反序列化-属性类型&显示特征 2、PHP-反序列化-CVE绕过&字符串逃逸 3、PHP-反序列化-原生类生成&利用&配合1、…

051-Web攻防-文件安全目录安全测试源码等

051-Web攻防-文件安全&目录安全&测试源码等 知识点1、文件安全-前后台功能点-下载&读取&删除 2、目录安全-前后台功能点-目录遍历&目录穿越演示案例:➢文件安全-下载&删除-案例黑白盒 ➢目录…

Dilworth定理及其在算法题中的应用

1. Dilworth定理 Dilworth定理由数学家Robert P. Dilworth于1950年提出,它描述了偏序集中链和反链之间的关系。偏序集:一个集合 equipped with a partial order(即一个自反、反对称、传递的关系)。 链:偏序集的一…

error: xxxxx does not have a commit checked out

$ git commit -m "test" *error: AW30N does not have a commit checked outfatal: updating files failed解决方法: 删除多余的文件夹AW30N

049-WEB攻防-文件上传存储安全OSS对象分站解析安全解码还原目录执行

049-WEB攻防-文件上传&存储安全&OSS对象&分站&解析安全&解码还原&目录执行-cnblog#文件-解析方案-执行权限&解码还原 1、执行权限文件上传后存储目录不给执行权限 原理:开启禁止目录执行…

云原生周刊:MetalBear 融资、Chaos Mesh 漏洞、Dapr 1.16 与 AI 平台新趋势

云原生热点 MetalBear 获得 1250 万美元种子轮融资,推动 Kubernetes 开发解决方案 以色列初创公司 MetalBear 宣布完成 1250 万美元种子轮融资,由 TLV Partners 领投,TQ Ventures、MTF、Netz Capital 及多位知名天使…

AI一周资讯 250913-250919

原文: https://mp.weixin.qq.com/s/bnJ-kyOojPi6rqgx0NOXxg 阿里版Cursor正式收费!Qoder全球推出付费订阅,小白用了都说“最懂我” 2025年9月15日,阿里AI编程平台Qoder(被称为“阿里版Cursor”)面向全球用户正式推…

045-WEB攻防-PHP应用SQL二次注入堆叠执行DNS带外功能点黑白盒条件-cnblog

045-WEB攻防-PHP应用&SQL二次注入&堆叠执行&DNS带外&功能点&黑白盒条件-cnblog PHP-MYSQL-二次注入-DEMO&74CMS1、DEMO-用户注册登录修改密码1.注册新用户时,将注入的内容包含在注册的用户名…

linux 命令语句

rt 快csp初赛了,发现s组第一题一般是linux 命令语句,碎屑。 c cat:连接和显示文件内容 cd:切换工作目录 chmod:修改文件或目录的权限 chown:修改文件或目录的所有者 cp:复制文件或目录 d df/du:显示磁盘使用情…

用 Kotlin 实现英文数字验证码识别

在本教程中,我们将使用 Kotlin 和 Tesseract OCR 库实现对英文数字验证码的识别。Tesseract 是一个开源的 OCR 引擎,能够从图像中提取文本内容。结合 Kotlin 的简洁语法,我们可以高效地完成这个任务。环境准备 (1)…

UM2003A 一款 200 ~ 960MHz ASK/OOK +18dBm 发射功率的单发射

UM2003A 一款 200 ~ 960MHz ASK/OOK +18dBm 发射功率的单发射Si24R03 是一款高度集成的低功耗 SOC 芯片,其集成了基于 RISC-V 核的低功耗 MCU 和工作在 2.4GHz ISM 频段的无线收发器模块。 MCU 模块具有低功耗、L…

达芬奇(DaVinci Reslove)字体文件 bugb标签

今天有小伙伴 突然 反馈 字幕轨导 execl的插件 字幕没有导出来。我拿到 srt文件是 文件1这样格式,我导入字幕轨后 ,再导出来 格式变了 多了 一个 <…

语音芯片怎样挑选?语音芯片关键选型要点?

语音芯片怎样挑选?语音芯片关键选型要点? 选择语音芯片需根据具体应用场景和性能需求进行综合评估,以下是关键选型要点: 一、核心性能参数 1、采样率与信噪比 高采样率(如16位ADC)可减少声音失真,信噪比≥75dB能…

KingbaseES Schema权限及空间限额

一、权限授予操作 1. 基础权限赋予 1.1 创建测试环境-- 1.创建测试用户 test=# CREATE USER schema_user WITH PASSWORD Schema@123; CREATE ROLE-- 2.创建测试Schema test=# CREATE SCHEMA test_schema AUTHORIZATION…

UM2003A 一款 200 ~ 960MHz ASK/OOK +18dBm 发射功率的单发射芯片

UM2003A 一款 200 ~ 960MHz ASK/OOK +18dBm 发射功率的单发射芯片UM2003A 是一款工作于 200 ~ 960MHz 频段的单片集成、高性能、可独立运行的 OOK 发射器。内部集成的 OTP 方便用户对各种射频参数以及特色功能进行编程…

HTTP库开发实战:核心库与httpplus扩展库示例解析

实战导向的HTTP库开发教程!本文以核心库基础功能为起点,结合httpplus扩展库示例,演示如何高效实现HTTP协议相关功能。 一、两个库有何不同? 首先需要了解,LuatOS采用核心库和扩展库的模块化设计,核心库负责底层与…