pytorch深度学习笔记16

目录

摘要

1.AdaGrad

2.RMSProp

3.Adam


摘要

本篇文章继续学习尚硅谷深度学习教程,学习内容是AdaGrad,​​​​​​​RMSPropAdam

1.AdaGrad

AdaGrad(Adaptive Gradient,自适应梯度)会为每个参数适当地调整学习率,并且随着学习的进行,学习率会逐渐减小。

  • h:历史梯度的平方和

这里就表示了梯度的平方和,即,这里的表示对应矩阵元素的乘法。

使用AdaGrad时,学习越深入,更新的幅度就越小。如果无止境地学习,更新量就会变为0,完全不再更新。

AdaGrad的代码实现如下:

class AdaGrad: def __init__(self, lr=0.01): self.lr = lr self.h = None def update(self, params, grads): if self.h is None: self.h = {} for key, val in params.items(): self.h[key] = np.zeros_like(val) for key in params.keys(): self.h[key] += grads[key] * grads[key] params[key] -= self.lr * grads[key] / (np.sqrt(self.h[key]) + 1e-7)

2.​​​​​​​RMSProp

RMSProp(Root Mean Square Propagation,均方根传播)是在AdaGrad基础上的改进,它并非将过去所有梯度一视同仁的相加,而是逐渐遗忘过去的梯度,采用指数移动加权平均,呈指数地减小过去梯度的尺度。

  • h:历史梯度平方和的指数移动加权平均
  • :权重

3.Adam

Adam(Adaptive Moment Estimation,自适应矩估计)融合了Momentum和AdaGrad的方法。

  • :学习率
  • :一次动量系数和二次动量系数
  • :迭代次数,从1开始

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1160225.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring 事务核心知识点全梳理(编程式 + 声明式 + 注解详解)

一、事务的基础概念1. 什么是事务?事务是一组不可分割的操作集合,这组操作要么 “同时成功”,要么 “同时失败”(即 “原子性”)。比如转账时 “扣 A 账户钱 加 B 账户钱”,这两步必须作为一个整体执行&am…

【源码 + 文档】SpringBoot+Vue 开发网上购物商城系统(附完整设计文档)

【源码 文档】SpringBootVue 开发网上购物商城系统(附完整设计文档) 哈喽,我是你们的技术干货博主~今天给大家分享一个基于 SpringBootVue 开发的网上购物商城系统,包含前端商城 后端管理系统,还附带了完…

OpenCode:开源AI代理如何改变你的编程工作流

OpenCode是开源AI编码代理工具,代表AI编程从"补全"到"对话"再到"代理"的演进。它采用终端优先设计,支持多会话并行、MCP生态扩展,强调隐私与可控性。文章详解了其核心优势:开源可控、终端优先工作流…

对 两种不同AI范式——Transformer 和 LSTM 进行解剖和对比

这不仅仅是两个模型的比较,更是两种AI范式的对话。一、 设计哲学:两种世界观维度LSTM的世界观Transformer的世界观核心隐喻时间的诗人:认为世界是动态的、连续的流。理解当下,必须回顾过去,记忆在时间中流淌和演变。空…

支持向量机 (SVM) 通俗解读

想象一下,你是一个老师,要把一群调皮的学生分成两队:一队爱踢足球的,一队爱打篮球的。你不想让他们混在一起打架,所以你需要在操场上画一条线,把两队分开。但不是随便画一条,你要画得尽可能宽敞…

【正点原子STM32MP157学习篇】A7和M4联合调试(通过STM32CubeIDE)

文章目录1 概要2 Remoteproc 框架简介2.1 Remoteproc 框架2.2 实验准备2.2.1 硬件连接2.2.2 启动 Linux 操作系统3 使用 STM32CubeIDE 进行调试3.1 操作步骤3.2 fw_cortex_m4.sh 脚本分析1 概要 本章节将介绍如何A7和M4进行联合调试,我们在分析 STM32CubeMP1 固件包…

提示工程架构师别再等!Agentic AI的3大市场优势,已经让同行抢先一步了

提示工程架构师别再等!Agentic AI的3大市场优势,已经让同行抢先一步了关键词:Agentic AI 提示工程 自主决策 工具协同 商业效率 摘要:当你还在为“如何写更好的提示”绞尽脑汁时,同行已经用Agentic AI(智能…

【MIMO OFDM】小波变换MIMO OFDM通信仿真【含Matlab源码 14928期】

💥💥💥💥💥💥💥💥💞💞💞💞💞💞💞💞💞Matlab领域博客之家💞&…

深度测评8个AI论文工具:本科生毕业论文写作全解析

深度测评8个AI论文工具:本科生毕业论文写作全解析 2026年AI论文工具测评:为何需要一份精准指南 随着人工智能技术的不断进步,越来越多的本科生开始依赖AI论文工具来提升写作效率和质量。然而,面对市场上琳琅满目的选择&#xff0c…

如何用云服务器搭建PUBG服务器?

云服务器搭建PUBG服务器完整指南一、服务器配置要求硬件配置推荐根据PUBG游戏的性能需求,建议选择以下配置:最低配置:CPU:Intel Core i5-4430 / AMD FX-6300内存:8GB RAM存储:50GB可用空间(推荐…

租赁Anritsu MT8852B蓝牙测试仪

收到!👍 我来帮你梳理 Anritsu MT8852B蓝牙测试仪 的核心参数与典型应用场景,接下来会从功能、支持标准到实际用途全面展开。 该设备支持蓝牙BR/EDR/BLE多种模式的射频与音频测试,并兼容最新蓝牙5.x标准,广泛用于研发验…

Excel VBA 编程基础学习笔记 · 第六章:字典技术 - 掌握高级数据映射与处理的王牌工具

目录 第6章:VBA与字典技术 1、字典技术的魅力 2、字典语法基础 3、字典实例(第1次与最后一次采购价提取) 4、字典实例(多表求不重复值) 5、字典实例(字典与数组经典结合) 6、字典实例(分类计算) 7、字典应用(多列合并计算…

大模型产业价值链深度解析:从基础设施到应用层的全景指南

大模型产业呈现四层价值链架构,当前超60%价值集中于基础设施层,未来将向MaaS服务及应用层传递。应用层分为软件平台(轻量化高毛利)和硬件载体(重投资长周期)。大模型厂商可选择开源、闭源或混合策略。基础设施层整合IDC承载、硬件算力、系统集成及软件调…

Excel VBA 编程基础学习笔记 · 第四章:事件编程 - 打造智能交互的自动化引擎

目录 第四课:Excel VBA事件过程 1、EXCEL事件程序定义与作用 2、事件程序基础 3、工作表事件实例1(自选计算与投票统计) 4、工作表事件实例2(状态栏地址与防工作表名更改) 5、工作表事件实例3(自动列出工作表名与…

【MIMO通信】MIMO检测器(ZF、MMSE、SIC、ML)在瑞利衰落下的BER性能比较【含Matlab源码 14929期】含报告

💥💥💥💥💥💥💥💥💞💞💞💞💞💞💞💞💞Matlab领域博客之家💞&…

BUUCTF-[ACTF2020 新生赛]Upload

打开靶机后发现是一个文件上传的题目随便上传一个文件观察路径和返回的方式是什么发现只能上传jpg,png,gif的文件上传一个jpg文件发现页面会回显返回的路径既然有路径了我们就可以尝试上传一句话木马了构造一句话木马<?phpeval($_POST[rc]);?>导入字典观察过滤的哪些后…

幂等性设计指南:从数据库唯一索引到 Redis Token,如何防止用户“手抖”重复提交?

标签: #架构设计 #幂等性 #Redis #数据库 #分布式系统 #面试必问 💣 前言:即使前端置灰了按钮,后端也必须防重 很多初级开发者认为:“我在前端点击按钮后,把按钮置灰(Disabled)不就行了吗?” 太天真。 懂点技术的用户可以直接调 API 接口。 弱网环境下,请求发出去了…

发刊不用愁:paperxie 期刊论文功能,一键匹配普通刊 / 核心刊的学术标准

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/aippt https://www.paperxie.cn/ai/journalArticleshttps://www.paperxie.cn/ai/journalArticles 对于科研人员和学生来说&#xff0c;“期刊论文投稿” 从来不是 “写完文字” 这么简单 —— 普通刊要符…

PointMAE的代码配环境+运行

PointMAE的笔记 PointMAE的代码地址 1. 环境配置 我的cuda是115安装Pointnet2_PyTorch总是失败 所以我在隔离环境中创建了cuda113的环境 参考pip 隔离环境内 安装 cuda 113 不覆盖原有的全局 cuda 115 1.1 安装torch pip install torch1.12.1cu113 torchvision0.13.1cu113…

CMake:现代C/C++项目的构建中枢

CMake&#xff1a;现代C/C项目的构建中枢 引言&#xff1a;从构建混乱到标准化 想象你正在开发一个跨平台的C库&#xff0c;需要在Windows、Linux、macOS上都能构建。在CMake出现之前&#xff0c;这意味着&#xff1a;为Visual Studio编写.vcxproj文件为Linux编写复杂的Mak…