实用指南:逻辑回归(Logistic Regression)

news/2025/11/27 20:00:30/文章来源:https://www.cnblogs.com/yangykaifa/p/19279293

逻辑回归=线性回归+sigmoid函数

逻辑回归简介

逻辑回归(Logistic Regression)是一种用于解决二分类问题的统计学习方法,通过将线性回归的输出映射到[0,1]区间,表示概率。尽管名称中包括“回归”,但逻辑回归实际用于分类任务

核心公式(Sigmoid函数)

逻辑回归利用Sigmoid函数(或称Logistic函数)将线性组合映射为概率
$ P(y=1 \mid \mathbf{x}) = \sigma(\mathbf{w}^T \mathbf{x} + b) = \frac{1}{1 + e^{-(\mathbf{w}^T \mathbf{x} + b)}} $
其中:

  • $\mathbf{x}$为输入特征向量,$\mathbf{w}$为权重参数,$b$为偏置项。
  • $\sigma(\cdot)$为Sigmoid函数,输出范围(0,1)

极大似然估计

极大似然估计的基本概念

极大似然估计(Maximum Likelihood Estimation, MLE)是一种统计方法,用于从观测数据中估计参数。其核心思想是找到一组参数,使得观测数据在该参数下出现的概率最大

似然函数 $L(\theta \mid x)$ 是参数$\theta$的函数,表示在给定观测信息$x$ 时参数 $\theta$的可能性。

MLE 的目标是最大化似然函数:\hat{\theta}{\text{MLE}} = \arg\max{\theta} L(\theta \mid x)

极大似然估计的步骤

构建似然函数假设观测素材$x_1, x_2, \dots, x_n$独立同分布(i.i.d.),

似然函数为:L(\theta \mid x) = \prod_{i=1}^n f(x_i \mid \theta)

其中 $f(x_i \mid \theta)$是概率密度函数(连续变量)或概率质量函数(离散变量)。

取对数似然函数

由于连乘计算复杂,通常取对数似然函数:\ell(\theta \mid x) = \log L(\theta \mid x) = \sum_{i=1}^n \log f(x_i \mid \theta)

求导并解方程$\ell(\theta \mid x)$ 关于 $\theta$求导,并令导数为零:\frac{\partial \ell(\theta \mid x)}{\partial \theta} = 0(使得原函数取到最值)

解此方程得到$\hat{\theta}_{\text{MLE}}$


举个例子就是:

假设我有一个硬币,正常来说投到正反的概率相同,假设投出正面的概率是i,那么投出反面的概率是1-i,那么我许可很轻松算出投出4个正面和6个反面的概率是P=(i)^4(1-i)^6

如果投出正面的概率是0.5,那么投出反面的概率也是0.5,投出4个正面和6个反面的概率是P=(0.5)^4(1-0.5)^6

0.5,要求我去计算,而我在投出10枚硬币后,发现出现了四次正面和六次反面,其概率是就是但是现在投出正面的概率不知道,可能也不P=(i)^4(1-i)^6

既然事情已经发生,为了计算概率,当然要使这件事情发生的概率尽可能大,

比如抽奖10抽中了6抽,我不会认为抽中一次的概率是1%,而是认为在60%左右

这里使P=(i)^4(1-i)^6发生概率尽可能大才会使得结果更准确,

这个函数由两部分组成,当i趋近于1时(i-1)会接近0导致结果变小,

同样当i趋近于0时i会接近0,也导致结果变小,

所以求解办法一般是求导,当导数为0取到极大值


正常来说回归函数是用来算一个估计值,逻辑回归会把这个值限制在0-1之间

这里的转化会造成一部分损失

逻辑回归的损失函数

逻辑回归通常采用对数似然损失函数(Log-Likelihood Loss),也称为交叉熵损失(Cross-Entropy Loss)。其核心思想是凭借最大化似然函数来优化模型参数。

二元逻辑回归的损失函数

对于二元分类挑战(标签为0或1),损失函数定义如下:

L(y, \hat{y}) = - \frac{1}{N} \sum_{i=1}^{N} \left[ y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right]

其中:

  • y_i是第 i个样本的真实标签(0或1)。
  • \hat{y}_i是模型预测的概率值(即\hat{y}_i = \sigma(w^T x_i + b),其中 \sigma是sigmoid函数)。
  • N是样本数量。

损失函数的推导

逻辑回归假设数据服从伯努利分布,通过极大似然估计推导损失函数:

解释:

  • 定义sigmoid函数将线性输出映射到概率:\hat{y}_i = \sigma(z_i) = \frac{1}{1 + e^{-z_i}}, \quad z_i = w^T x_i + b
  • 似然函数为:\mathcal{L}(w, b) = \prod_{i=1}^{N} \hat{y}_i^{y_i} (1 - \hat{y}_i)^{1 - y_i}
  • 取负对数似然(转换为最小化困难):-\log \mathcal{L}(w, b) = -\sum_{i=1}^{N} \left[ y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right]

损失函数的作用

损失函数计算出的结果用于衡量模型预测值与真实值之间的差异。这个差异值在机器学习和深度学习中扮演着关键角色,直接影响模型的训练和优化过程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/978923.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CTIP 与 3D-IC 堆栈热行为仿真实践

随着芯片工业进入异质集成、芯片堆叠(3D-IC / 2.5D)的时代,热管理(thermal management)成为设计可靠性与性能优化中不可或缺的一环。堆叠芯片内部以及封装与系统层级的温度分布若未得到合理预测与控制,可能导致热…

Mac 安装 4K Video Downloader v5.0.0.5303-1.dmg 方法(附安装包)

Mac 安装 4K Video Downloader v5.0.0.5303-1.dmg 方法(附安装包)​ 4K Video Downloader for Mac v5.0.0.5303-1.dmg 是一款专门在苹果电脑(Mac)上下载高清视频的工具。它可以把 YouTube、B站、Facebook 等网站的…

浮点数定点表示(Q格式)

深度学习神经网络模型中的量化是指浮点数用定点数来表示,也就是在DSP技术中常说的Q格式。 Q格式 Q格式表示为:Qm.n,表示数据用m比特表示整数部分,n比特表示小数部分,共需要m+n+1位来表示这个数据,多余的一位用作…

TPS的另外一层含义:绝对并发用户数 - BKY007

我们在做性能压测的时候,由于测试负载机资源有限,我们的并发用户数设置其实并不大 都是通过循环来实现多批次请求,来实现总的请求数量。 这时你会发现50个用户并发你可以请求5万或10万的请求,你计算出的TPS是随着并…

P10547 [THUPC 2024 决赛] 排列游戏

太非人类了。 首先想如果给定一个排列如何简单的判断合法,再困难的计数题如果连这个都不可以简单计数那就完犊子了。 经典结论是交换距离为 \(\sum [p_i > i](p_i - i) \le m\),容易证明充分性,必要性可以感性理…

NeurlPS 2025!多伦多大学TIRE助力3D/4D 生成精准保留主体身份

创新方法:提出三阶段方法(Track, Inpaint, Resplat),分别用于识别需要填充的区域、逐步填充未观察到的区域以及将2D填充观察结果重新投影回3D空间。论文标题:Track, Inpaint, Resplat: Subject-driven 3D and 4D …

笔记——OI中求逆元的几种方式(不含数学知识的讲解)

ps:除exgcd写法外均要求mod为素数 费马小定理求逆元 for(int i=1;i<=n;i++){inv[i]=ksm(i,mod-2); }线性求逆元 for(int i=1;i<=n;i++){inv[i]=(mod-mod/i)*inv[mod%i]%mod; }求阶乘逆元 先处理出最大的那个,每…

关于量化对模型表现的影响

之前一直知道量化会对模型有影响,但是没法具体感知到差别,最近使用qwen3-vl:30b-a3b模型时,就实实在在的感知到了。上图: (原图未打码)本人不是小黑子,对图中人不熟悉,大家不要冲我。

2025国内公关公司排名推荐(整合权威数据源):十大机构深度对比,专业分析与选择指南

国内top10公关公司(综合衡阳新闻、咸宁新闻、中钢、河青新闻网等权威信息) 第一名:智者品牌 核心优势:智者品牌是全球领先的数字化整合营销集团之一,拥有一支650多人的专业高效团队,凭借专业的创意策划能力与品效…

SpringBoot集成LangChain4j快速开发AI应用(调用阿里云Api) - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

中美大数据产业的十年分岔路 - 智慧园区

“有些人走着走着就散了。 十几年前,当中美两国的工程师们都在热烈讨论Hadoop、Spark和开源社区时,他们仿佛站在同一个新大陆的海岸线上,共享着同一套工具和几乎一致的技术信仰。 那是以技术为驱动、以效率为圭臬的…

【论文精读】DreamVideo:定制化主体与动作的视频生成技能

【论文精读】DreamVideo:定制化主体与动作的视频生成技能pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consola…

acme证书申请

1Mg4iPPmdgm5j1exz4W0c5ZuvCMvnAYFivHE_W-V export CF_Key="1Mg4iPPmdgm5j1exz4W0c5ZuvCMvnAYFivHE_W-V" export CF_Email="2806429860@qq.com"

NOIP模拟赛11.27

今天打了一场NOIP模拟赛。 T1:暴力+一些思维+二分小优化,结果少写了一句话,100pts->60pts,痛失40分 T2:结论题,想出结论结果没写对,最后只写了一个暴力,100pts->40pts,痛失60分 T3:一些思维+欧拉路径,…

Open WebUI大模型输出完成后新对话响应延迟、输出变慢问题

Open WebUI时回答完后经常会遇到新提问回答响应延迟、或输出变慢的问题,通过显卡风扇明显可以感知后台依然占用计算资源,在运行。 该问题在LM Studio上不明显,但是使用Open WebUI就会明显感觉到,主要问题在于Open …

[CEOI 2025] Equal Mex 题解

[CEOI 2025] Equal Mex 题解[CEOI 2025] Equal Mex 虽然说是套路题,但是记录一下一些结论防止自己以后忘了。 首先不难发现你划分出的每个子段的 \(\operatorname{mex}\) 一定就是整个区间的 \(\operatorname{mex}\),…

法语动词变位

忍好久了。 第三组变位怎么这么 tm 烦啊。 今天突发奇想,是不是能让 AI 把我没能力实现的想法实现一下。我去还真可以啊! 那就粘在下面吧~~~ 以后说不定会补充,但也有可能记本子上。 🇫🇷 法语第三组动词变位规…

日总结 32

html5 和flash区别: Flash 核心功能 | HTML5 替代方案 | 说明 矢量动画 / 逐帧动画 | CSS3 动画 / 过渡 + SVG + Canvas | CSS3 做简单动效,SVG 做矢量动画,Canvas 做逐帧 / 复杂动…

2025年11月液体容器磁致伸缩液位计,格雷母线,lvdt位移传感器厂家最新推荐,容器监测与位移适配指南

2025年11月液体容器磁致伸缩液位计、格雷母线、LVDT位移传感器厂家最新推荐在工业生产中,液体容器的监测以及位移适配是保障生产安全与高效运行的重要环节。而杭州浙达精益机电技术股份有限公司(TEC品牌)就是一家在…

2025年11月掘进机位移传感器,拦焦车位移传感器,推焦车位移传感器厂家最新推荐,焦化设备适配测评

2025年11月位移传感器厂家推荐:杭州浙达精益适配焦化设备测评在2025年11月,对于掘进机、拦焦车、推焦车位移传感器的选择,众多厂家中,杭州浙达精益机电技术股份有限公司(TEC品牌)值得重点关注。该公司成立于1993…