机器学习 - 需要了解的条件概率、高斯分布、似然函数

似然函数是连接数据与参数的桥梁,通过“数据反推参数”的逆向思维,成为统计推断的核心工具。理解它的关键在于区分“参数固定时数据的概率”与“数据固定时参数的合理性”,这种视角转换是掌握现代统计学和机器学习的基础。

一、在学习似然函数之前,我们需要弄懂什么是条件概率

概率是指在事件 B 已经发生的前提下,事件 A 发生的概率,记作 P(A|B),读作“在 B 发生的条件下 A 发生的概率”。其定义为:

其中,P(A ∩ B)表示事件 A 和事件 B 同时发生的概率,P(B) 表示事件 B 发生的概率。需要注意的是,P(B)必须大于零,否则条件概率无法定义。

示例:

一个标准的52张扑克牌堆,问从中随机抽取一张牌,这张牌是红心的概率是多少?这是一个无条件概率问题,答案(红心) = 13/52 = 1/4。

现在,假设已知抽到的牌是一张(或方片),在此条件下,这张牌是红心的条件概率是多少?这是一个条件概率问题。

设事件 A 为“抽到红心”,事件 B 为“抽到红色牌”,则:

  • P(A ∩ B) = P(红心) = 13/52
  • P(B) = P(红心或方片) = 26/52 = 1/2

因此,条件概率 P(A|B) 为:

需要注意的是,条件概率 P(A|B) 与 P(B|A) 一般不相等。例如,在上述例子中,P(红心|红色牌) = 1/2,而 P(红色牌|红心) = 1,因为在抽到红心的情况下,必然是一张红色牌。

条件概率在统计学、概率论以及机器学习等领域有广泛的应用,特别是在贝叶斯定理中,条件概率是核心概念之一。

二、还需要弄懂什么是高斯分布?

(一)高斯分布

高斯分布(也称为正态分布)是统计学中最常见的连续概率分布之一。其概率密度函数呈对称的钟形曲线,描述了数据在均值附近的集中程度。高斯分然科学和社会科学中广泛应用,常用于表示未知的随机变量。

概率密度函数

对于均值为 μ、标准差为 σ 的高斯分布,其概率密度函数为:

其中,μ 决定了分布的位置,σ 决定了分布的幅度。

标准正态分布: μ = 0、σ = 1 时,标准正态分布,其概率密度函数为:

性质:

  • **对称性:*斯分布关于均值 μ 对称。

  •  68-95-99.7 规则: 在高斯分布中,约68%的数据位于均值±1σ范围内,约95%位于均值±2σ范围内,约99.7%位于均值±3σ范围内。

在三维视图中,二维高斯分布的概率密度函数图像类似于一个倒置的碗,中心最高,向四周逐渐降低。其数学表达式为::

应用:

高斯分布在统计学中具有重要地位,常用于描述自然和社会科学中的随机变量。例如,在测量误差分析中,假设误差服从高斯分布可以简化分析过程。

此外,根据中心极限定理,当对大量独立同分布的随机变量求和时,其和的分布趋近于高斯分布,这使得高斯分布在统计推断中尤为重要。

需要注意的是,虽然高斯分布在理论和应用中广泛存在,但并非所有数据都服从高斯分布。在进行数据分析时,应首先检验数据的分布特性,以选择适当的统计模型。

为了直观理解,我们来看一下高斯分布对应的图像:

高斯分布(也称为正态分布)的图像呈现为对称的钟形曲线,其形状由均值(μ)和标准差(σ)决定。均值 μ 确定曲线的中心位置,标准差 σ 控制曲线的宽度和高度。标准差越小,曲线越陡峭;标准差越大,曲线越平坦。

(二)形象理解高斯分布

1. 直观比喻

想象你在测量一群人的身高:

  • 高斯分布:大部分人的身高集中在某个平均值附近(如170cm),极端高或矮的人较少。

  • 观测数据 y:每次测量的身高值(如169cm、171cm、168cm等)。

  • 假设 y 服从高斯分布:意味着这些测量值围绕某个“中心值”波动,且波动规律符合高斯分布的形状(钟形曲线)。

2. 具体场景

以线性回归为例:

三、然后来掌握什么是似然函数

1.认识连乘运算符“∏”的用法:

2.了解独立同分布的意义:

在概率论与统计学中,独立同分布(Independent and Identically Distributed,简称 i.i.d.)指一组随机变量彼此独立,且服从相同的概率分布。这意味着每个随机变量的取值不会影响其他变量的取值,并且它们具有相同的分布特性。

独立:随机变量之间互不影响,即一个变量的取值不依赖于其他变量的取值。

同分布:所有随机变量遵循相同的概率分布,具有相同的分布函数、期望值和方差等统计特性。

示例

  • 抛硬币实验:假设我们进行多次抛硬币实验,每次记录硬币正面朝上的结果。每次抛掷都是独立的(一次抛掷的结果不影响另一次),且每次抛掷的结果服从相同的分布(正面和反面的概率相同)。因此,这些抛掷结果构成一组独立同分布的随机变量。

  • 掷骰子实验:假设我们多次掷骰子,每次记录掷出的点数。每次掷骰子都是独立的,且每次的结果服从相同的分布(每个点数出现的概率相同)。因此,这些掷骰子的结果也是独立同分布的随机变量。

独立同分布是许多统计推断和机器学习方法的基础假设。例如,在训练机器学习模型时,通常假设训练数据是从同一分布中独立采样的,以确保模型对新数据的有效性。

需要注意的是,独立同分布并不意味着每个事件发生的概率都相同,而是指随机变量之间相互独立,并且遵循相同的概率分布。

3.认识似然函数

(1)似然函数的概念

给定一组独立同分布的数据样本 x1,x2,...,xn,假设它们服从高斯分布,则似然函数表示在给定参数(μ, σ²)下,观测到这组数据的概率。

由于对数函数是单调递增的,通常对似然函数取对数,得到对数似然函数:

通过最大化对数似然函数,可以估计参数μ和σ²的值。

因此,似然函数和高斯分布的关系在于,假设数据服从高斯分布时,似然函数基于高斯分布的概率密度函数构建,用于估计分布的参数。

定义:

似然函数是统计学中用来 “衡量模型参数在已知数据下的合理性” 的工具。简单来说,它通过观测到的数据,告诉我们 “不同参数值对产生这些数据的可能性有多大”

核心思想:逆向思维
  • 概率:已知参数 → 预测数据可能性
    (例:已知硬币是公平的(参数θ=0.5),抛10次出现6次正面的概率是多少?)

  • 似然:已知数据 → 推测参数可能性
    (例:抛10次硬币观察到6次正面,此时参数θ=0.5的“似然值”有多大?θ=0.6呢?)

类比

  • 概率:天气预报说“明天下雨的概率70%” → 预测未来。

  • 似然:今天下雨了 → 推测“气象台模型参数设置是否合理”。

数学形式

(2)如何理解“似然”

(3)最大似然估计(MLE

(4)关键区别:似然 vs 概率

(5)常见误区和实际应用场景:

  • 误区1:认为“似然值高”等于“参数正确”。
    → 实际只能说明“参数对当前数据更合理”。

  • 误区2:混淆似然函数与后验概率。
    → 后验概率 = 似然 × 先验概率(需贝叶斯框架)。

  • 误区3:忽略数据的独立性假设。
    → 若数据不独立,联合似然的乘积形式不成立。

  1. 参数估计:如线性回归、逻辑回归中的MLE。

  2. 模型选择:通过比较不同模型的似然值(如AIC准则)。

  3. 假设检验:构建似然比检验(Likelihood Ratio Test)。

这篇文章,我整理了学习最大似然估计之前的基础知识,在掌握了这些知识之后,我们下一步进行学习线性回归中,求最优参数的最大似然估计的方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/69525.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[LUA ERROR] bad light userdata pointer

Cocos2d项目,targetSdkVersion30,在 android 13 设备运行报错: [LUA ERROR] bad light userdata pointer ,导致黑屏。 参考 cocos2dx 适配64位 arm64-v8a 30 lua 提示 bad light userdata pointer 黑屏-CSDN博客的方法 下载最新的Cocos2dx …

使用Docker + Ollama在Ubuntu中部署deepseek

1、安装docker 这里建议用docker来部署,方便简单 安装教程需要自己找详细的,会用到跳过 如果你没有安装 Docker,可以按照以下步骤安装: sudo apt update sudo apt install apt-transport-https ca-certificates curl software-p…

导航守卫router.beforeEach

router.beforeEach 是一个全局前置守卫,在每次路由跳转之前都会触发。 //index.jsrouter.beforeEach((to, from, next) > {// 打印即将要进入的目标路由信息console.log(即将要进入的目标路由信息:, to)// 打印当前正要离开的路由信息console.log(当前正要离开的…

systemverilog的program和module的区别

1. 设计目的 module 硬件建模:用于描述数字电路的结构和行为(如组合逻辑、时序逻辑、连线等)。 层次化设计:支持模块化设计,可嵌套其他模块或接口(interface)。 仿真周期内持续存在&#xff1…

网络编程基础1

七层协议模型和四层协议模型 七层协议模型:物理层、数据链路层、网络层、传输层、会话层、表示层、应用层 四层协议模型:链路层、网络层、传输层、应用层 TCP通信流程 服务器端 (1)创建socket(socket) (2)绑定自己的IP(bind) (3)监听客户端连接(liste…

【C#】一维、二维、三维数组的使用

在C#中,数组是用于存储固定数量相同类型元素的数据结构。根据维度的不同,可以分为一维数组、二维数组(矩阵阵列)、三维数组等。每增加一个维度,数据的组织方式就会变得更加复杂。 一维数组 一维数组是最简单的数组形…

网络安全警示录:.wex勒索病毒的独特特性与应对之道

在数字化时代,网络安全威胁层出不穷,其中勒索病毒已成为企业和个人用户面临的一大挑战。近年来,.wex勒索病毒以其独特的加密方式和广泛的传播手段,给全球网络安全带来了严重威胁。本文将深入探讨.wex勒索病毒的独特特性&#xff0…

【Golang学习之旅】Go + Redis 的缓存设计与优化

文章目录 前言1. Go与Redis的简介1.1 什么是Redis?1.2 为什么选择Redis? 2. Redis安装于配置2.1 安装Redis2.2 配置Redis 3. Go中使用Redis的基本操作3.1 连接Redis3.2 设置缓存3.3 删除缓存 4. 缓存设计与优化4.1 缓存的粒度设计4.2 缓存失效策略4.3 缓…

【STM32系列】利用MATLAB配合ARM-DSP库设计IIR数字滤波器(保姆级教程)

ps.源码放在最后面 设计FIR数字滤波器可以看这里:利用MATLAB配合ARM-DSP库设计FIR数字滤波器(保姆级教程) 设计IIR滤波器 MATLAB配置 设计步骤 首先在命令行窗口输入"filterDesigner",接着就会跳出以下界面&#xf…

迁移学习 Transfer Learning

迁移学习(Transfer Learning)是什么? 迁移学习是一种机器学习方法,它的核心思想是利用已有模型的知识来帮助新的任务或数据集进行学习,从而减少训练数据的需求、加快训练速度,并提升模型性能。 &#x1f…

makefile 的strip,filter,ifeq,ifneq基础使用

目录 一、strip1.1 语法1.2 示例1.3 使用场景 二、filter2.1 语法2.2 示例2.3 使用 * 和 ? 通配符2.4 结合使用2.5 使用场景 三、ifeq 和 ifneq3.1 ifeq3.1.1 语法3.1.2 示例 3.2 ifneq3.2.1 语法3.2.2 示例 3.3 典型使用场景3.3.1 根据版本控制编译选项:3.3.2 选择不同的源文…

25/2/8 <机器人基础> 阻抗控制

1. 什么是阻抗控制? 阻抗控制旨在通过调节机器人与环境的相互作用,控制其动态行为。阻抗可以理解为一个力和位移之间的关系,涉及力、速度和位置的协同控制。 2. 阻抗控制的基本概念 力控制:根据感测的外力调节机械手的动作。位置…

RKMPP依赖硬件单元

rkmpp(Rockchip Media Process Platform)主要依赖瑞芯微(Rockchip)芯片中的 VPU(Video Process Unit,视频处理单元) 和 RGA(Raster Graphic Acceleration Unit,2D图形加速…

android的ViewBinding的使用

参考: 安卓开发中的ViewBinding使用

C++线程池

使用线程情况比较频繁的地方,由于线程的创建及销毁都会产生对资源的占用及性能的损耗。为了优化性能,提升效率,在这种场景中,就应该使用线程池来处理任务。 线程池创建的关键点: 装载线程的容器,在C中使用…

一周发生AI事件总结(02.08)

本周人工智能领域发生的所有事件: Ilya Sutskever的初创公司正洽谈以约200亿美元估值进行融资:据路透社报道,由前OpenAI首席科学家Ilya Sutskever创立的人工智能初创公司Safe Superintelligence正洽谈以“至少”200亿美元的估值进行融资。该…

FFmpeg(一) 简介

FFmpeg 官网 FFmpeg 下载 ffmpeg-release-essentials.7z ffmpeg-release-full-shared.7z FFmpeg既是一款音视频编解码工具,同时也是一组音社频编解码开发套件 FFmpeg包含 多种音视频编码多种协议的流媒体多种色彩格式转换多种采样率转换多种码率转换多种丰富的…

Android内存性能优化量化指标

在 Android 开发中,对内存性能进行优化至关重要,这有助于提升应用的稳定性和流畅度,避免因内存问题导致的卡顿、崩溃等现象。以下是一些常见的 Android 内存性能优化量化指标: 内存占用指标 堆内存使用量 定义:堆内…

linux 基础知识点之工作队列workqueue

多年前就了解了workqueue着玩意,但理解上就并不是很很深刻,今天重新梳理一下,本文重点的是哪个些现成的demo代码,都是可以直接拿来用的,这就是写这文章的目的和作用,就是为了备份后续工作用到的时候&#x…

【CubeMX+STM32】SD卡 文件系统读写 FatFs+SDIO+DMA

本篇,将使用CubeMXKeil,创建一个SD卡的 FatFSSDIODMA 文件系统读写工程。 目录 一、简述 二、CubeMX 配置 FatFSSDIO DMA 三、Keil 编辑代码 四、实验效果 实现效果,如下图: 一、简述 上两篇,已循序渐进讲解了SD、…