深入解析:深度学习——Logistic回归中的梯度下降法

news/2025/11/21 19:12:55/文章来源:https://www.cnblogs.com/yangykaifa/p/19254200

4.5 梯度下降法

损失函数是衡量单一训练样例的效果,成本函数用于衡量w和b的效果,在全部训练集上衡量。下面我们讨论如何使用梯度下降法(the gradient descent algorithm)去训练或者学习训练集上的参数w和b。

下面是熟悉的logistic回归算法,第二行是成本函数,定义为平均值。即1/m的损失函数之和。损失函数许可衡量算法的效果。每一个训练样例,都输出,把它和根本真值标签进行比较,等号右边是完整的公式。

成本函数衡量了参数w和b在训练集(training set)上的效果,要学习到合适的参数w和b,即为使得成本函数尽可能小的w和b,下面是梯度算法介绍。横轴表示参数w和b,实际上,w可以是更高维的,为了方便绘图,w和b都是一个实数。成本函数是在水平轴w和b上的曲面,曲面的高度代表J(w,b)在某一点的值,我们需要找到w和b使得对应的成本函数最小,可能看到成本函数J(w,b)是一个凸函数,像一个碗。为了找到更好的w和b,我们要做的就是用某初始化的w和b(在图中表示为小红点),对于logistic回归来说,几乎任意初始化都是有效的,通常是0。梯度下降法就是从初始的点开始,朝着最抖得下坡方向走一步,在梯度下降一步后或许在那里停下,这是梯度下降的一次迭代,两次迭代或许会抵达那里。这张图片阐述了梯度下降法。

:重复执行以下的更新操作,我们更新w的值,用:=来表示更新w。在算法收敛前,重复这样去做。就是让我们来看一些函数,你希望得到最小化的J(w),函数可能如下图,为了方便,先忽略b,用一维曲线代替多维,梯度下降法的步骤α表示学习率,学习率可能控制每一次迭代或者梯度下降法中的步长。之后会讨论如何选择α

现在w在初始值位置(右侧最高点),对应成本函数J(w)在曲线上的一点,导数的定义是曲线在这一点的斜率,这里导数是正的,新的w值等于w减去学习率乘以导数,因此w接着向左走一步。算法使得w渐渐减小。反之,如果w在左侧最高点,此时导数是负的,w值等于w减去学习率乘以导数,w就会渐渐增大。无论w在哪里,梯度下降法会朝着全局最小值方向移动。

当前J(w)的梯度下降法,只有参数w,在logistic回归算法中,成本函数是一个含有w和b的函数,此时,梯度下降执行以下两个式子更新w和b。在编写代码时,dJ/dω表示,dJ/dbdb表示。

另外,想要明确一下在微积分的符号约定中,dJ/dω表示为αJ/αω,当J有两个以上的变量时,使用α来代表偏导数符号。使用α还是d取决于函数的变量个数。

4.6 计算图

在这里举一个比logistic回归更简单的神经网络的例子。J是a,b,c的函数:

有三个步骤,计算u=bc,计算v=a+u,计算J=3v。可以画成如下流程图,举个例子,对a,b,c赋值为5,3,2,此时J=33。能够看到这样一个从左到右的流程可以计算出J

下图为整理后的计算图,通过反向传播算法计算导数,实际上核心就是链式传播法则,这里吴恩达老师的视频讲的比较基础。

4.7 logistic回归中的梯度下降法

回顾一下logistic回归中的损失函数,现在只考虑单个样本,关于该样本的损失函数定义如下,a真值标签值(ground truth label),写在写出该样本的偏导数流程图,假设样本只有两个特征x1和x2,为了计算z,我们必须输入参数w1、w2和b。然后,计算就是是logistic回归的输出,y\widehat{y}。最后计算

在logistic回归中,我们要做的是,变换参数w和b的值,来最小化损失函数,在前面我们已经通过前向传播步骤,在单个样本上计算损失函数。现在让我们讨论如何反向传播计算偏导数。下面是计算图。

假如想要计算损失函数的导数,第一要向前一步,计算损失函数关于a的导数,在代码中,使用da来表示这个变量,现在进一步计算dz,损失函数关于dz的导数。最终一步,计算关于w1、w2和b的导数

最后,更新w和b:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/972471.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

for循环的详细解析for...of循环同时获取下标和data

✅ 方法 1:使用 entries()(推荐) for (const [index, data] of iconModelData.children.entries()) {console.log(index, data); } entries() 会把数组元素转成 [index, value] 的形式。 ✅ 方法 2:传统 for 循环 …

2025 年知名的成都二手集装箱公司最新 TOP 排行榜

2025 年知名的成都二手集装箱公司最新 TOP 排行榜2025 年知名的成都二手集装箱公司最新 TOP 排行榜 随着成都物流产业与临建市场的蓬勃发展,二手集装箱凭借高性价比成为企业降本增效的优选。经过对资质实力、产品品质…

2025-11-20

CF Problem - 982C - Codeforces(搜索)(dfs) 找最大删除边数,使得每一棵树的顶点数都为偶数 #include <bits/stdc++.h> using namespace std; #define LL long long const LL mod = 998244353; const int N…

2025 年热门海运集装箱行业知名厂家排行榜!

2025 年热门海运集装箱行业知名厂家排行榜!​ 2025 年全球海运集装箱市场规模持续扩张,吞吐量突破 10 亿 TEU,亚洲市场占比超 50% 成为核心增长极。在绿色航运与数字化转型的浪潮下,一批兼具实力与口碑的企业脱颖而…

完整教程:AtCoder真题及详细题解 ABC427C: Bipartize

完整教程:AtCoder真题及详细题解 ABC427C: Bipartize2025-11-21 19:03 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; d…

面向对象程序设计-前3次作业总结

题目集1-3的总结 前言: 前三次作业用到了以下知识点: 1.类的创建与设计 2.类的方法实现 3.面向对象编程基础思想 4.类的单一职责原则应用 5.正则表达式的使用 6.队列管理 LinkedList 及其各个方法的使用 难度以及题量…

[豪の算法奇妙冒险] 代码随想录算法训练营第三天 | 203-移除链表元素、707-设计链表、206-反转链表

LeetCode203 移除链表元素、LeetCode707 设计链表、LeetCode206 反转链表代码随想录算法训练营第三天 | 203-移除链表元素、707-设计链表、206-反转链表LeetCode203 移除链表元素题目链接:https://leetcode.cn/proble…

2025年11月北京/东城区/西城区/朝阳区/海淀区/丰台区/石景山区遗产继承律师,遗产咨询律所Top10专业推荐排行权威榜单

2025年遗产继承法律行业持续增长,随着人口老龄化和财富积累,需求显著上升。本文基于行业数据、用户口碑和专业评估,为您提供2025年11月遗产继承律师律所Top10推荐榜单,帮助您快速找到靠谱服务。榜单包含详细排名、…

2025年11月北京/东城区/西城区/朝阳区/海淀区/丰台区/石景山区遗产继承、遗产纠纷,遗产咨询律师事务所权威排行榜单:专业律所推荐与选择指南

摘要 2025年遗产继承法律服务行业呈现专业化、精细化发展趋势,随着人口老龄化加剧和财富传承需求增长,北京地区遗产继承案件数量年均增长15%以上。本文基于权威数据、用户口碑和行业专家评估,为您提供2025年11月最具…

目前需要我去更新的东西

trick选记 atc/cf vp joist/joisc 选做 数论 杭电选做

南屏晚钟

我匆匆地走入森林中 森林它一丛丛 我找不到他的行踪 只看到那树摇风 我匆匆地走入森林中 森林它一丛丛 我看不到他的行踪 只听到那南屏钟 南屏晚钟 随风飘送 它好象是敲呀敲在我心坎中 南屏晚钟 随风飘送 它好象是催呀…

Linux初级命令练习:通过awk、sed如何批量创建用户

批量创建用户test01-test10方法1.使用awk 创建test01---test05第一步:第二步:第三步:第四步:查看结果方法2.使用sed 创建test06---test10第一步:第二步:第三步:查看结果

详细介绍:压缩与缓存调优实战指南:从0到1根治性能瓶颈(四)

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

sqli-labs 1(Less-1-Less-10)新手解题思路 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

PyMAF 2023 单张照片估计参数化人体

https://github.com/HongwenZhang/PyMAF/tree/smplx

实用指南:【设计模式】适配器模式(Adapter)

实用指南:【设计模式】适配器模式(Adapter)2025-11-21 18:33 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: …

完整教程:【人工智能】神经网络的优化器optimizer(四):Adam自适应动量优化器

完整教程:【人工智能】神经网络的优化器optimizer(四):Adam自适应动量优化器pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-…

轻松速通:TTS播放、文件播放与录音的核心功能解析!

无论是开发语音助手、音频播放器,还是录音工具,TTS播放、文件播放与录音都是绕不开的核心功能。本文提炼核心流程,帮你跳过冗余细节,快速掌握这三大功能的核心实现逻辑。 一、概述 本文档详细介绍了基于 Air8000 开…

2025 中国法兰阀门十大品牌推荐:密封升级 + 场景适配,优质厂家护航流体系统安全

法兰阀门作为管道连接中的核心部件,凭借连接牢固、密封性能好的优势,广泛应用于石油化工、市政工程、能源电力、船舶制造等众多领域。2025 年,随着工业生产规模扩大与民生基建升级,市场对法兰阀门的密封可靠性、耐…