网站建设管理员角色设置wordpress链接微信

bicheng/2026/1/25 17:31:45/文章来源:
网站建设管理员角色设置,wordpress链接微信,手机怎样用网站做成软件,html网站设计实例代码注#xff1a;本文为《动手学深度学习》开源内容#xff0c;部分标注了个人理解#xff0c;仅为个人学习记录#xff0c;无抄袭搬运意图 7.7 AdaDelta算法 除了RMSProp算法以外#xff0c;另一个常用优化算法AdaDelta算法也针对AdaGrad算法在迭代后期可能较难找到有用解的… 注本文为《动手学深度学习》开源内容部分标注了个人理解仅为个人学习记录无抄袭搬运意图 7.7 AdaDelta算法 除了RMSProp算法以外另一个常用优化算法AdaDelta算法也针对AdaGrad算法在迭代后期可能较难找到有用解的问题做了改进 [1]。有意思的是AdaDelta算法没有学习率这一超参数。 Adadelta是一种自适应学习率的方法用于神经网络的训练过程中。 它的基本思想是避免使用手动调整学习率的方法来控制训练过程而是自动调整学习率使得训练过程更加顺畅。 7.7.1 算法 AdaDelta算法也像RMSProp算法一样使用了小批量随机梯度 g t \boldsymbol{g}_t gt​按元素平方的指数加权移动平均变量 s t \boldsymbol{s}_t st​。在时间步0它的所有元素被初始化为0。给定超参数 0 ≤ ρ 1 0 \leq \rho 1 0≤ρ1对应RMSProp算法中的 γ \gamma γ在时间步 t 0 t0 t0同RMSProp算法一样计算 s t ← ρ s t − 1 ( 1 − ρ ) g t ⊙ g t . \boldsymbol{s}_t \leftarrow \rho \boldsymbol{s}_{t-1} (1 - \rho) \boldsymbol{g}_t \odot \boldsymbol{g}_t. st​←ρst−1​(1−ρ)gt​⊙gt​. 与RMSProp算法不同的是AdaDelta算法还维护一个额外的状态变量 Δ x t \Delta\boldsymbol{x}_t Δxt​其元素同样在时间步0时被初始化为0。我们使用 Δ x t − 1 \Delta\boldsymbol{x}_{t-1} Δxt−1​来计算自变量的变化量 g t ′ ← Δ x t − 1 ϵ s t ϵ ⊙ g t , \boldsymbol{g}_t \leftarrow \sqrt{\frac{\Delta\boldsymbol{x}_{t-1} \epsilon}{\boldsymbol{s}_t \epsilon}} \odot \boldsymbol{g}_t, gt′​←st​ϵΔxt−1​ϵ​ ​⊙gt​, 其中 ϵ \epsilon ϵ是为了维持数值稳定性而添加的常数如 1 0 − 5 10^{-5} 10−5。接着更新自变量 x t ← x t − 1 − g t ′ . \boldsymbol{x}_t \leftarrow \boldsymbol{x}_{t-1} - \boldsymbol{g}_t. xt​←xt−1​−gt′​. 最后我们使用 Δ x t \Delta\boldsymbol{x}_t Δxt​来记录自变量变化量 g t ′ \boldsymbol{g}_t gt′​按元素平方的指数加权移动平均 Δ x t ← ρ Δ x t − 1 ( 1 − ρ ) g t ′ ⊙ g t ′ . \Delta\boldsymbol{x}_t \leftarrow \rho \Delta\boldsymbol{x}_{t-1} (1 - \rho) \boldsymbol{g}_t \odot \boldsymbol{g}_t. Δxt​←ρΔxt−1​(1−ρ)gt′​⊙gt′​. 可以看到如不考虑 ϵ \epsilon ϵ的影响AdaDelta算法跟RMSProp算法的不同之处在于使用 Δ x t − 1 \sqrt{\Delta\boldsymbol{x}_{t-1}} Δxt−1​ ​来替代学习率 η \eta η。 7.7.2 从零开始实现 AdaDelta算法需要对每个自变量维护两个状态变量即 s t \boldsymbol{s}_t st​和 Δ x t \Delta\boldsymbol{x}_t Δxt​。我们按AdaDelta算法中的公式实现该算法。 %matplotlib inline import torch import sys sys.path.append(..) import d2lzh_pytorch as d2lfeatures, labels d2l.get_data_ch7()def init_adadelta_states():s_w, s_b torch.zeros((features.shape[1], 1), dtypetorch.float32), torch.zeros(1, dtypetorch.float32)delta_w, delta_b torch.zeros((features.shape[1], 1), dtypetorch.float32), torch.zeros(1, dtypetorch.float32)return ((s_w, delta_w), (s_b, delta_b))def adadelta(params, states, hyperparams):rho, eps hyperparams[rho], 1e-5for p, (s, delta) in zip(params, states):s[:] rho * s (1 - rho) * (p.grad.data**2)g p.grad.data * torch.sqrt((delta eps) / (s eps))p.data - gdelta[:] rho * delta (1 - rho) * g * g使用超参数 ρ 0.9 \rho0.9 ρ0.9来训练模型。 d2l.train_ch7(adadelta, init_adadelta_states(), {rho: 0.9}, features, labels)输出 loss: 0.243728, 0.062991 sec per epoch7.7.3 简洁实现 通过名称为Adadelta的优化器方法我们便可使用PyTorch提供的AdaDelta算法。它的超参数可以通过rho来指定。 d2l.train_pytorch_ch7(torch.optim.Adadelta, {rho: 0.9}, features, labels)输出 loss: 0.242104, 0.047702 sec per epoch小结 AdaDelta算法没有学习率超参数它通过使用有关自变量更新量平方的指数加权移动平均的项来替代RMSProp算法中的学习率。 参考文献 [1] Zeiler, M. D. (2012). ADADELTA: an adaptive learning rate method. arXiv preprint arXiv:1212.5701. 注除代码外本节与原书此节基本相同原书传送门

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/86781.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站开发自学还是培训wordpress 去掉左上角

顶级程序员的心得 –– Coders at Work说明:这篇文章是我 2010 年的原创,但是发现 csdn 的版本把格式全部搞坏了,原文在这里 我2009年读了 “Coders at Work”, 这是作者对15 位顶级程序员的采访, 总共600页。 从采访的模式看&…

自建站网站wordpress首页链接新标签打开

删除重复文件能够为电脑腾出很大的存储空间,不信?可以试试看哦! 电脑使用久了,都会积累大量的文件,这其中难免会出现重复的文件,这些重复文件没有任何作用,而且会占用着电脑的空间,…

濮阳网站建设通图片头像制作免费生成器

1.简介 双指针技巧是一种常见的算法解题方法,通过使用两个指针在数据结构上同时移动,可以解决多种问题。这种技巧通常适用于数组、字符串和链表等数据结构,下面我将详细介绍双指针技巧的特点和应用场景: 特点: 快慢…

页游网站wordpress网址导航插件

游戏开始后,随着音乐会给出不同的动作提示,用户按照提示摆出正确动作即可得分。援引官方说法,“尬舞机”主要应用了今日头条 AI Lab 自主开发的“人体关键点检测技术”,依靠这项技术,抖音能够检测到图像中所包含人体的…

西安网站建设收费标准网站建设捌金手指花总十

题目&#xff1a;一个3阶的数字矩阵如下&#xff1a; 1 2 3 8 9 4 7 6 5 现在给定数字n(1<n≤20)&#xff0c;输出n阶数字矩阵。 思路&#xff1a; 放出一条好玩的贪吃蛇&#xff0c;按照右下左上的顺序吃蛋糕&#xff0c;一边吃蛋糕&#xff0c;一边拉数字&#xff1b…

做ppt的动图下载哪些网站软件开发主要几个步骤

1. uniapp 本地存储的方式 在uniapp开发中&#xff0c;本地存储是一个常见的需求。本地存储可以帮助我们在客户端保存和管理数据&#xff0c;以便在应用程序中进行持久化存储。本文将介绍uniapp中本地存储的几种方式&#xff0c;以及相关的代码示例。 1.1. 介绍 在移动应用开发…

当地信息网站建设资质天津网站建设制作免费

Selenium怎么来的&#xff1f; Selenium这个词&#xff0c;是化学元素硒&#xff08;Se&#xff09;的意思。在软件测试领域&#xff0c;它是绝对的自动化测试开源项目的标杆。取这个名字也是有讲究的&#xff0c;在当时乃至如今的软件测试领域&#xff0c;QTP(UFT)占有率非常…

网站空间就是虚拟主机吗网站后台怎么做

最近&#xff0c;我在系统地学习大型语言模型&#xff08;LLM&#xff09;的相关知识。在这个学习过程中&#xff0c;我努力将所学的内容整理成博客文章。在这篇博客中&#xff0c;我首先简要介绍了人工智能的发展历史&#xff0c;然后探讨了大型模型的基本原理、训练方法、微调…

找人做网站 优帮云建立网站的英文怎么说

工作致富的第一步&#xff1a;写一份好的简历。一个独特、简单、清晰的个人简历模板可以更好地吸引雇主的注意和兴趣&#xff0c;并帮助你在许多求职者中脱颖而出。如何制作一份令人印象深刻的简历&#xff1f;巧妙地使用个人简历模板是一个不错的选择。在本文中&#xff0c;我…

广州网站维护市住房城乡建设部网站

多孔结构板在减轻结构重量、满足吸声功能等环境下应用广泛&#xff0c;本案例采用ANSYS Workbench对曲线边界孔洞的随机多孔板进行轴心受拉力学分析。 随机微穿孔板可采用CAD Voronoi插件构建&#xff0c;三维模型构建如下。 CAD Voronoi插件采用参数化建模方式&#xff0c;根…

做网站的团队业绩怎么写杭州公司注销网站备案

LeetCode-503. 下一个更大元素 II【栈 数组 单调栈】 题目描述&#xff1a;解题思路一&#xff1a;单调栈。思路是利用循环数组来维护一个单调递减栈&#xff0c;遇到当前元素比栈顶元素大的就出栈&#xff0c;在出栈的时候维护出栈元素的结果&#xff08;即当前元素是出栈元素…

动易网站网站地图 html

基于chatgpt的聊天机器人 以下是一个基于Python的示例代码&#xff0c;展示如何在本地环境中使用预训练的ChatGPT模型构建一个简单的聊天机器人应用程序。在这个示例中&#xff0c;我们将使用Hugging Face Transformers库加载GPT-2模型&#xff0c;并创建一个基于命令行的用户…

设计一份包含网站建设范爱站网长尾词挖掘工具

JWT&#xff1a;全称是JSON Web Token是目前最流行的跨域身份验证、分布式登录、单点登录等解决方案。 通俗地来讲&#xff0c;JWT是能代表用户身份的令牌&#xff0c;可以使用JWT令牌在api接口中校验用户的身份以确认用户是否有访问api的权限。 授权&#xff1a;这是使用JWT的…

网站建设人员任职要求上海营销网站建设公司

文章目录 0 前言1 背景2 算法原理2.1 动物识别方法概况2.2 常用的网络模型2.2.1 B-CNN2.2.2 SSD 3 SSD动物目标检测流程4 实现效果5 部分相关代码5.1 数据预处理5.2 构建卷积神经网络5.3 tensorflow计算图可视化5.4 网络模型训练5.5 对猫狗图像进行2分类 6 最后 0 前言 &#…

沈阳的网站制作公司wordpress 伪静态html

Java大数据开发和安全开发 &#xff08;一)Java的变量和方法1.1 成员变量1.2 成员方法1.3 static关键字1.3.1 static修饰成员变量1.3.1 static修饰成员变量的应用场景1.3.1 static修饰成员方法1.3.1 static修饰成员方法的应用场景1.3.1 static的注意事项1.3.1 static的应用知识…

高端网站建设推荐万维科技福州自助建站

一、火热的储能行业&#xff0c;寻求新的市场机会 最近一段时间以来&#xff0c;世界储能大会、上海储能展、能源电子产业发展大会等多个储能相关论坛和展览密集登场&#xff0c;即使“内卷”已成为了业内讨论的热词&#xff0c;但寻求新的市场机会仍然是行业共识&#xff0c;…

seo 网站关键词优化网站响应式和电脑手机

API 接口 生成完成 生成聊天完成 创建模型 列出本地模型 显示模型信息 复制模型 删除模型 拉取模型 推送模型 生成嵌入 列出运行中的模型 版本 约定 模型名称 模型名称遵循 model:tag 格式&#xff0c;其中 model 可以有一个可选的命名空间&#xff0c;例如 ex…

汕头网站关键排名南山区宝安区福田区

在 XGBoost 中&#xff0c;模型截距&#xff08;也称为基本分数&#xff09;是一个值&#xff0c;表示在考虑任何特征之前模型的起始预测。它本质上是处理回归任务时训练数据的平均目标值&#xff0c;或者是分类任务的赔率对数。 在 XGBoost 中&#xff0c;每个叶子节点都会输…

做网站后台要学什么iis wordpress伪静态

在arcgis中&#xff0c; dBASE 文件除了 WHERE 语句以外&#xff0c;不支持 其它 SQL 命令。选择窗口如下&#xff1a; 首先&#xff0c;我们了解下什么是where语句。 WHERE语句是SQL语言中使用频率很高的一种语句。它的作用是从数据库表中选择一些特定的记录行来进行操作。WHE…

电子商务网站建设指导思想做网站需要会什么软件

python实现ModBusTCP协议的server是一件简单的事情&#xff0c;只要通过pymodbus、pyModbusTCP等模块都可以实现&#xff0c;本文采用pymodbus。 相关文章见&#xff1a; python实现ModBusTCP协议的client-CSDN博客 一、了解pymodbus的Server 1、pymodbus.server的模块 pym…