完整教程:概率论直觉(三):边缘化

news/2026/1/17 19:55:24/文章来源:https://www.cnblogs.com/yangykaifa/p/19497024

这里介绍一下概率论与信息论中的一个核心设备:边缘化(marginalization)。

我们遇到的是:\sum_{x_1, \dots, x_n} P(x_1, \dots, x_n) \log P(x_1) = \sum_{x_1} P(x_1) \log P(x_1)

我们注意到 log P(x_1) 只依赖于 x_1,与 x_2,…,x_n 无关。所以求和可以拆成两部分:先固定 x_1,对 x_2,…,x_n 求和,再对 x_1 求和。

\sum_{x_1, \dots, x_n} P(x_1, \dots, x_n) \log P(x_1) = \sum_{x_1} \left[ \log P(x_1) \sum_{x_2,\dots,x_n} P(x_1, \dots, x_n) \right]

根据边缘概率的定义:P(x_1) = \sum_{x_2,\dots,x_n} P(x_1, x_2, \dots, x_n)

于是得到:= \sum_{x_1} \left[ \log P(x_1) \cdot P(x_1) \right]

就是我们要的右边部分,这个推导的关键是把依赖于多个变量的函数的联合概率求和,通过边缘化简化成只依赖于部分变量的求和。

边缘化的直观理解:当有联合分布 P(X,Y) 时,有时我们只关心 X 的概率规律,而不管 Y 的具体值。

P(X) = \sum_{Y} P(X, Y)

可能看作“把 Y 的影响累加(或积分)掉”,剩下 X 的分布。它的物理意义是,P(X=a) 是在所有可能的 Y 下,事件 X=a 发生的总概率。就像在统计全班学生的(性别, 成绩)联合分布时,要是只想知道性别的分布,就把同一性别的所有成绩的概率加起来。

它确实很关键!

(1)贝叶斯定理中:P(A|B) = \frac{P(B|A)P(A)}{\sum_{A'} P(B|A')P(A')}

分母就是边缘化:P(B) = \sum_{A} P(B,A) = \sum_{A} P(B|A)P(A)

如果没有边缘化,就无法由联合概率得到条件概率公式。

(2)期望计算时,期望的定义:\mathbb{E}[g(X)] = \sum_x g(x) P(X=x)

但要是 X,Y 是联合分布,你想计算\mathbb{E}[g(X)],允许直接计算:

\mathbb{E}[g(X)] = \sum_x \sum_y g(x) P(X=x, Y=y) = \sum_x g(x) \sum_y P(X=x, Y=y) = \sum_x g(x) P(X=x)

中间步骤就是边缘化。这说明了在联合分布上计算只依赖于 X 的函数的期望时,可以先将联合分布边缘化成 X 的分布。

(3)信息论中的熵的链式法则H(X_1,\dots,X_n) = \sum_{i=1}^n H(X_i|X_1,\dots,X_{i-1})的推导中,用到的就是此种边缘化技巧来分离变量。

另外,联合熵H(X,Y) = -\sum_{x,y} p(x,y) \log p(x,y)

H(X) = -\sum_x p(x) \log p(x)正是借助边缘化p(x)=\sum_y p(x,y) 来关联的。

:就是(4)模型推断与隐变量,在含有隐变量 Z 的模型中,观测数据 X 的似然P(X) = \sum_Z P(X, Z),这是很多EM算法等的基础,就是通过联合概率边缘化得到观测数据的概率。

更抽象地看,边缘化是一种“约化”思想。在概率论中,我们从联合分布提取出部分变量的信息,本质上是一种投影或降维,从高维联合分布到低维边缘分布。


我们行把边缘化看作一种概率分布的降维投影。高维空间,联合分布 P(X_1, X_2, …, X_n) 定义在所有变量构成的“网格”上。投影到低维子空间,比如只关心 X_1 的分布,就是沿着 X_2, …, X_n 这些轴的方向“挤压”概率质量。想象一个二维的联合概率表(X 行,Y 列),求 P(X) 就是把每一行的所有列加起来,写在表格的边缘,这正是“边缘分布”名称的来源。

|——| Y=1 | Y=2 | Y=3 | P(X) |
| X=1 | 0.1 | 0.2 | 0.1 | 0.4 | 这一行求和
| X=2 | 0.05 | 0.25 | 0.3 | 0.6 | 这一行求和
| P(Y) | 0.15 | 0.45 | 0.4 | 1.0 |

通过边缘化 Y 得到的。就是表格最右边的列 P(X) 就

为什么边缘化在概率计算中如此“丝滑”?边缘化的“丝滑”建立在概率论的两个根本公理之上:

归一性:\sum_{\text{all } x_1,\dots,x_n} P(x_1,\dots,x_n) = 1得到有效的概率分布。就是。这保证了在边缘化时,不会出现无穷大或发散问题,总

可加性:互斥事件的概率许可直接相加,这是边缘化能成立的核心:P(X=a) = \sum_y P(X=a, Y=y)

“丝滑”的边缘化之所以成立,是因为\{ (X=a, Y=y_1) \}, \{ (X=a, Y=y_2) \}, \dots这些事件互斥,不可能同时发生,所以能够直接相加得到“X=a”该事件的总概率。

求和与函数交换的便利:当你有一个只依赖于部分变量的函数时(比如 g(X)),在联合分布上求期望:

\mathbb{E}[g(X)] = \sum_{x,y} g(x) P(x,y) = \sum_x g(x) \sum_y P(x,y) = \sum_x g(x) P(x)

这种交换求和顺序的“丝滑”,源于双重求和的可交换性和概率的非负性,保证了求和顺序不影响结果。

如果不是概率场景?如果在一般的多元函数 f(x,y) 上做类似操作:h(x) = \sum_y f(x,y)一个普通的“部分求和”,没有独特的概率意义。但在概率中,因为 P(x,y) 有归一性和可加性,h(x) 自动成为一个合法的边缘概率分布。就是。这只

“边缘化”这个词确实主要出现在概率统计领域,但它的数学本质是:对一个多元函数在某些维度上求和(或积分),得到较少变量的函数。这种操作在其他领域也有,但名称不同:物理学,可能会说“对某个自由度求和/积分”。统计力学,叫“配分函数的约化”或“trace out”,迹掉某些自由度。泛函分析,类似“投影算子”。数据科学:有时叫“聚合(aggregation)”。但在非概率语境中,这种执行不一定保持归一性,因为没有概率公理约束,结果不一定有“分布”的解释。

所以,“边缘化”该词确实带着强烈的概率论基因,它不仅描述了数学操作,如求和/积分,还隐含了结果是一个合法的概率分布这层含义。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1174600.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

生成对抗网络(GANs)深度解析:从原理、变体到前沿应用

前言 自2014年由Ian Goodfellow及其同事首次提出以来,生成对抗网络(Generative Adversarial Networks, GANs)已成为深度学习领域最引人注目和最具革命性的思想之一。它通过一个巧妙的“对抗”框架,使得模型能够学习并生成与真实数…

SSM459的汽车零配件维修管理系统vue

目录SSM459汽车零配件维修管理系统Vue摘要开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!SSM459汽车零配件维修管理系统Vue摘要 该系统基于SSM(SpringSpringMVCMyBatis)框架与Vue.js前端技术开发&#…

深入解析:软件测试分类与BUG管理

深入解析:软件测试分类与BUG管理pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco&q…

ssm460大连环保公益网vue

目录SSM460大连环保公益网Vue项目摘要开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!SSM460大连环保公益网Vue项目摘要 大连环保公益网(SSM460)是一个基于SpringSpringMVCMyBatis(SSM&#…

ssm461高校智能排课系统

目录高校智能排课系统摘要开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!高校智能排课系统摘要 高校智能排课系统是一种基于SSM(SpringSpringMVCMyBatis)框架开发的智能化教务管理工具,旨在…

Elasticsearch 入门指南 - 教程

Elasticsearch 入门指南 - 教程2026-01-17 19:45 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !importa…

VMware vSphere 网络+存储 --1

vSphere 网络整体架构: 物理交换机 │vmnic(ESXi 主机物理网卡) │vSwitch / DVS │Port Group │VMkernel(vNIC) │ VM对象 本质vmnic 物理网卡vSwitch 软件交换机DVS(…

MongoDB Schema验证:灵活的数据结构控制方法

MongoDB Schema验证:灵活与约束的动态平衡技术解析 关键词 MongoDB Schema验证、JSON Schema、数据完整性、NoSQL约束、动态数据模型、验证规则优化、跨版本兼容 摘要 MongoDB作为典型的文档型NoSQL数据库,其“无Schema”特性(更准确的表述是…

时间序列分析实战:用 Python 实现股票价格预测与风险评估

在金融市场中,股票价格预测一直是投资者、分析师和学术界关注的焦点。时间序列分析作为统计学的重要分支,为理解和预测股票价格走势提供了科学的理论框架和方法工具。随着Python编程语言的普及和数据科学工具的成熟,越来越多的研究人员和从业…

Agent的能力边界通俗解说和总结

案例1:搭子小滴 https://mp.weixin.qq.com/s/norFlpaY6M_YgJZn_QGIpA 滴滴app,日常出行搭子小滴,这是滴滴上线的Agent。Agent加持,现在打车不用点来点去,只需要一句话,不光能选择油电动力、空气清新和车型…

从容器到 Docker 再到 Kubernetes 的进阶之路介绍 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

VMware vSphere 网络+存储 -- 1

vSphere 网络整体架构: 物理交换机 │vmnic(ESXi 主机物理网卡) │vSwitch / DVS │Port Group │VMkernel(vNIC)│VM对象 本质vmnic 物理网卡vSwitch 软件交换机DVS(Distributed V…

MySQL 数据备份流程化

背景 在 Linux 机器上用 Docker 部署了 MySQL 数据库,现在需要定期备份数据。备份策略是先在本地备份一份,然后传输到远程服务器。 环境信息: MySQL 容器:mysql-db数据卷路径:/home/docker/work_root/volumes/dev-db_s…

给“拉票”加点WebGL:我做了个能拖拽旋转的3D星图,每一面墙都是我的代码故事(附完整源码) | 博客之星求投票

文章目录 前言一、网页效果预览二、功能和交互式体验三、 技术实现详解1. 技术栈2. 分级渲染策略3. Three.js 3D场景搭建3.1 粒子系统(星空背景)3.2信息墙面(数据展示)3.3 光线效果 4. 数据管理与模态窗口 四、完整代码五、我的拉…

AI | AI4UI(2025.12)| 论文:Beyond Prototyping: Autonomous, Enterprise-Grade Frontend Development

Beyond Prototyping: Autonomous, Enterprise-Grade Frontend Development from Pixel to Production via a Specialized Multi-Agent Framework 超越原型设计:通过专用多智能体框架,实现从像素到生产环境的自主企业级前端开发 论文链接 主要贡献: 结…

金仓数据库KingbaseES IO性能优化指南

在数据库运维的日常工作中,IO性能绝对是影响系统“跑得快不快、稳不稳”的关键因素。按木桶原理来说,IO子系统要是拖后腿,哪怕CPU、内存再强悍也没用。尤其是金仓数据库KingbaseES扛着高并发事务、海量数据查询这类…

ssm695新型药物临床药品治疗方案信息管理系系统vue

目录项目背景技术架构核心功能模块创新点应用价值开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!项目背景 SSM695新型药物临床药品治疗方案信息管理系统基于Vue.js前端框架与SpringSpringMVCMyBatis(SSM&#xff0…

VMware vSphere 网络+存储

vSphere 网络整体架构: 物理交换机 │vmnic(ESXi 主机物理网卡) │vSwitch / DVS │Port Group │虚拟机 / VMkernel对象 本质vmnic 物理网卡vSwitch 软件交换机DVS(Distributed Virt…

基于SpringBoot+Vue.is的社区服务平台管理系统(源码+lw+部署文档+讲解等)

课题介绍本课题旨在设计并实现一套基于SpringBootVue.js的社区服务平台管理系统,以解决传统社区管理中服务流程繁琐、居民诉求响应滞后、信息传递不畅、资源调度低效等痛点,助力社区服务数字化、管理精细化、互动便捷化升级。系统采用前后端分离架构&…

交通仿真软件:VISSIM_(14).事故与异常情况模拟

事故与异常情况模拟 在交通仿真软件中,事故与异常情况的模拟是评估交通系统在极端条件下的性能和安全性的关键部分。通过模拟事故和异常情况,可以研究交通流的动态变化、驾驶员的行为反应以及交通管理措施的有效性。本节将详细介绍如何在VISSIM中模拟事故…