李宏毅机器学习笔记20 - 实践

news/2025/11/9 10:59:45/文章来源:https://www.cnblogs.com/gccbuaa/p/19203912

目录

摘要

Abstract

1.Feature normalization

2.Batch normalization

3.Batch normalization-testing


摘要

本篇文章继续学习李宏毅老师2025春季机器学习Feature normalization和Batch normalization相关概念及计算方法就是课程,学习内容

Abstract

This article continues the study ofProf. Hung-yi Lee's 2025 Spring Machine Learning Course, focusing on the concepts and computational methods ofFeature Normalization and Batch Normalization.

1.Feature normalization

假设两个参数w1,w2对loss的斜率相差很大,w1斜率变化小,w2斜率变化大,用固定的learning rate很难有好的结果,之前大家的解决办法是让learning rate自适应变化,而现在从另一个方向想,我们直接把难做的error surface去掉会不会好做一些。

举一个简单的例子,一个非常简单的model为然后计算的距离即为loss。假设x1输入都很小,w1变化对loss的影响就很小,就导致了w1斜率变化小;假设x2输入都很大,w2变化对loss的影响就很大,就算w2变化很,但是基于乘上了x2,所以loss变化很大,也就导致了w1斜率变化大。所以当我们的输入范围差距很大就会出现上述的这种情况。

那我们让输入有相同的范围就行使其变得更好训练, 一种做法是把所有的feature vector都集合起来,那我们把同一个dimension(维度)不同训练资料的feature vector的数值取出来,计算出均值记为,再计算他们的standard deviation(标准差)记为

接下来我们就允许做一个normalization,叫做标准化,把某个feature vector的某个维度的值减去之前算出的,再除得到一个值,记为。他们有一个特征就是某个维度上的平均值为0,方差为1。对所有的数据都处理后,他们的数值都在0上下,这样就可以制造出比较好训练的error surface。

2.Batch normalization

当我们搞定feature normalization后,依据layer 1,得到z,通过sigmoid或Relu得到a,再通过下一层,对第二层W2来说,实际上的输入是a,为上一层的输出,输出并没有做feature normalization,于是我们需要对a或z做feature normalization。

假设对z做feature normalization,我们将z1,z2,z3平均起来记为向量,再去计算向量中每个元素的标准差得到向量

用z1,z2,z3减去再除以(向量中的每个元素分别计算),最后得出结果向量,必须注意的是此时若是改变z1,会影响到导致,z2,z3也被更改。实际操作时,我们会让network考虑一个batch,因此我们是对一个batch里的数据做normalization,这也叫做batch normalization,适用于batch比较大的时候。

在batch normalization中还会需要进行额外操作,需要让乘上另一个向量(其中元素各自相乘,结果仍是向量)在加上一个向量,而是network另外的参数。初始是全一的向量,为全零的向量,在开始时不会影响,在后来训练到一定程度,他们会慢慢加进去。

3.Batch normalization-testing

在实际运作中,假设batch设置是64,但是资料并不足填满一个batch,此时的如何计算? 在训练中,我们每一个batch计算出的都会拿出来计算moving average,就是在训练中的所有会用于算一个平均值,用平均值代替。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/960322.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

性能监测火焰图原理及搭建

性能监测火焰图原理及搭建2025-11-09 10:56 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; f…

基于Java的车辆租赁管理平台/租车系统源码+运行步骤

功能介绍 平台采用B/S结构,后端采用主流的Springboot框架进行开发,前端采用主流的Vue.js进行开发。这是一个前后端分离项目,需要提前学习相关技术。努力吧少年 整个平台包括前台和后台两个部分。前台功能包括:首页…

2025年优秀的郑州注册公司高评分服务推荐

2025年优秀的郑州注册公司高评分服务推荐行业背景与市场趋势近年来,随着"放管服"改革深入推进和营商环境持续优化,郑州市场主体数量呈现爆发式增长。根据河南省市场监管局最新数据,2024年上半年郑州市新增…

实用指南:【Java】P15 Java 深入理解 “this” 关键字

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025年服务贴心的离婚财产分割律师口碑指数榜

2025年服务贴心的离婚财产分割律师口碑指数榜行业背景与市场趋势随着我国离婚率的持续攀升,离婚财产分割法律服务需求呈现爆发式增长。根据民政部最新统计数据,2024年全国离婚登记数量达到478.6万对,同比增长6.8%,…

php项目出现提示 no input file specified的解决方法集锦

问题分析与解决方案集锦 当PHP项目访问出现 "No input file specified" 错误且存在 .user.ini 文件时,核心问题是该文件中的配置指令干扰了PHP的正常执行。请按以下顺序排查: 第一步:快速锁定问题源临时重…

2025年靠谱的白水苹果精品推荐厂家

2025年靠谱的白水苹果精品推荐厂家白水苹果产业概况与市场趋势白水县作为中国西北地区重要的苹果生产基地,凭借其独特的地理环境和气候条件,已成为"世界最佳苹果优生区"之一。根据中国果品流通协会2024年发…

2025年诚信的建筑业体系认证管理体系认证专家推荐榜

2025年诚信的建筑业体系认证管理体系认证专家推荐榜行业背景与市场趋势随着中国建筑业的持续发展和规范化进程加速,行业对质量管理体系认证的需求呈现爆发式增长。根据中国建筑业协会最新发布的《2024年中国建筑行业发…

20251109-2

我才发现我这碰撞检测写的简直是一坨屎,稍微优化了一下,虽然依旧一坨屎。<!DOCTYPE html> <html lang="en"><head><meta charset="UTF-8"><meta name="viewpor…

深入解析:让AI说“人话“:TypeChat.NET如何用强类型驯服大语言模型的“野性“

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025年评价高的专利评估综合口碑榜

2025年评价高的专利评估综合口碑榜行业背景与市场趋势随着全球科技创新步伐加快,知识产权已成为企业核心竞争力的重要组成部分。根据世界知识产权组织(WIPO)最新数据显示,2024年全球专利申请量达到380万件,同比增…

2025年口碑好的耐高温劳保鞋厂家推荐及选择指南

2025年口碑好的耐高温劳保鞋厂家推荐及选择指南行业背景与市场趋势随着我国工业安全意识的不断提升,劳保用品市场规模持续扩大。据中国劳动防护用品行业协会统计,2024年我国劳保鞋市场规模已达85亿元,预计2025年将突…

基于高光谱成像和偏最小二乘法(PLS)的苹果糖度检测MATLAB实现

一、程序框架设计二、实现 1. 图像加载与预处理 %% 参数设置 clear; clc; imgPath = apple_hsi.mat; % 高光谱图像路径 roiSize = [50,50]; % ROI区域尺寸 wavelength = 400:10:1000; % 波长范围(nm)%% 加载数据…

2025年优质的青年鸡高评价榜

2025年优质的青年鸡高评价榜行业背景与市场趋势近年来,随着我国禽蛋产业规模化、标准化程度不断提升,青年鸡专业化养殖已成为行业重要发展方向。据中国畜牧业协会统计数据显示,2024年全国青年鸡市场规模已达185亿元…

day07-一键生成儿歌视频工作流

今日内容 1 一键生成儿歌背单词视频 1.1 目标 # 1 用户输入一个主题---》生成中英文儿歌,方便小朋友记忆不同主题的单词-动物--》10个动物单词儿歌-蔬菜--》10种蔬菜单词儿歌# 2 用到python代码--》稍微有些难度1.2 工…

实用指南:手机群控软件在游戏运营中的风险管控技术实现

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

Zabbix服务告警: Zabbix server: Utilization of icmp pinger processes over 75%

在 Zabbix 中,icmp pinger 主要用于执行主机 ping 检测。当告警提示“Utilization over 75%”,意味着所有 icmp pinger 进程在大部分时间都在忙碌中,系统没有足够的空闲进程来及时处理新的 Ping 请求。该值可以通过…

Process Monitor 学习笔记(5.2):事件模型与五大类操作(文档/注册表/进程/网络/Profiling

Process Monitor 学习笔记(5.2):事件模型与五大类操作(文档/注册表/进程/网络/Profiling2025-11-09 10:38 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !import…

flask: 用gunicorn部署flask项目

一,安装第三方库 $ pip3 install gunicorn gevent 二,使用 -D 后台运行(守护进程) -b 指定绑定地址和端口 -w 设置 4 个工作进程 $ gunicorn -D -b 127.0.0.1:8000 -w 4 app:app 测试 效果: 用ss查看端口是否已使…

2025年评价高的盐城短视频剪辑用户好评榜

2025年评价高的盐城短视频剪辑用户好评榜行业背景与市场趋势随着短视频行业的蓬勃发展,2025年中国短视频市场规模预计将达到1.5万亿元人民币,年复合增长率保持在25%以上。据《2025中国短视频行业白皮书》显示,短视频…