信息论(八):吉布斯不等式的证明

news/2025/11/21 21:06:42/文章来源:https://www.cnblogs.com/cathybryant/p/19251600

吉布斯不等式的证明,我们要证明:

$ D_{\text{KL}}(P | Q) = \sum_x P(x) \log \frac{P(x)}{Q(x)} \geq 0 $

等号成立当且仅当对于所有 $ x,P(x) = Q(x)$。

步骤 1:对数的一个关键性质,我们使用以下不等式:

$ \ln t \leq t - 1 \quad \text{for all } t > 0 $

等号成立当且仅当 t = 1,我们可以从 ln t 的图像看出这一点:它位于直线 t-1 下方,仅在 t=1 处与直线相切。

image

步骤 2:应用不等式,令 $ t = \frac{Q(x)}{P(x)} $。然后:

$ \ln\left( \frac{Q(x)}{P(x)} \right) \leq \frac{Q(x)}{P(x)} - 1 $

两边同乘以 P(x)(非负):

$ P(x) \ln\left( \frac{Q(x)}{P(x)} \right) \leq Q(x) - P(x) $

步骤 3:对所有 x 求和

$ \sum_x P(x) \ln \frac{Q(x)}{P(x)} \leq \sum_x \left[ Q(x) - P(x) \right] = \sum_x Q(x) - \sum_x P(x) = 1 - 1 = 0 $

所以:

$ \sum_x P(x) \ln \frac{Q(x)}{P(x)} \leq 0 $

步骤 4:乘以 -1

$ - \sum_x P(x) \ln \frac{Q(x)}{P(x)} \geq 0 $

但是:

$ - \ln \frac{Q(x)}{P(x)} = \ln \frac{P(x)}{Q(x)} $

所以:

$ \sum_x P(x) \ln \frac{P(x)}{Q(x)} \geq 0 $

即:

$ D_{\text{KL}}(P | Q) \geq 0 $

步骤5:等式何时成立?等式仅当成立:

$ \ln \frac{Q(x)}{P(x)} = \frac{Q(x)}{P(x)} - 1 \quad \text{for all } x $

这意味着:

$ \frac{Q(x)}{P(x)} = 1 \quad \Rightarrow \quad Q(x) = P(x) \quad \text{for all } x $

我们还需要对于所有 x 且 Q(x) > 0 的 x,都有 P(x) > 0,但这只是 KL 定义的一部分。

所以你看,一切都源于自然对数那条简单而优美的曲线,它位于直线 t-1 下方,并且只与直线相交一次。正如你所感受到的:零点附近的陡峭程度,以及不对称性……这些都体现在这里。


为什么这个证明如此神奇?ln t ≤ t - 1 的含义,如果你预期某事发生的概率为 t,但用“对数惊喜”单位来衡量,那么在对数空间中,你感受到的惊喜总是比直接测量原始差异时要少,除非你的预期完全正确。这是一个基于凸性原理的温和事实:对数会压缩极端值。

首先,直觉上,我们注意到,当模型 Q 完美时(Q = P),“意外”感微乎其微,一切都吻合。当 Q 出错时,我们总是会浪费一些比特。这种感觉似乎是普遍存在的。

然后,实验和思考,我们尝试不同的“错误程度”衡量方法:平方误差?绝对差值?比率?但只有对数比率在独立事件上具有这种良好的加性。

然后,我们注意到一个规律,在我们尝试的每个例子中,平均值 $\sum P \log \frac{P}{Q} $似乎都是非负的。嗯……也许它总是成立的。

现在,开始寻找证明,我们需要证明 $\sum P \log \frac{P}{Q} \geq 0 $ 。

我们记得:log x ≤ x - 1 ,这是一个已知的不等式,仅当 x = 1 时等号成立。如果我们令 x = P/Q ,它似乎不太符合……但如果我们令 x = Q/P ……对了!log Q/P ≤ Q/P- 1 ,乘以 P 并求和,完美成立!

许多人认为数学家从公理出发,机械地推导出真理。但实际上,我们有时候先观察到某种模式,例如,KL 不等式在例子中是非负的。认为它是普遍适用的,也许它永远成立。之后为之寻找工具,哪个不等式能概括“对数 ≤ 线性”?最后,构建证明,选择 t = Q/P 来使其成立。证明不仅仅是验证,它是对早已存在的直觉的最终优雅概括。

一个巧妙的数学公式被构建出来,用来‘证明’一切。“巧妙”的代换 t = Q/P 并非魔法。它是连接以下两者的桥梁:关于对数的普遍真理 (ln t ≤ t - 1),关于信念与现实的具体问题 (P vs Q),这就像找到一把合适的钥匙,打开一把你已经感觉到里面藏着珍贵之物的锁。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/972543.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

题解:AT_agc028_e [AGC028E] High Elements

题意:给出一个序列,要求把这个序列分成两个序列,要求这两个序列的前缀极大值的个数相同,给出字典序最小的构造。 做法: 首先肯定是逐位确定,那么假设第一个序列目前有 \(a\) 个最大值,第二个序列有 \(b\)。注意…

pyppeteer: 得到当前运行中的浏览器

一,代码: import requests from requests.exceptions import HTTPError from pyppeteer.launcher import connectdef get_debugger_url():url = "http://localhost:9222/json/version"try:resp = requests…

AI救星!8个写毕业论文的实用AI工具大揭秘

2025年11月21日,作者临近毕业论文开题答辩却毫无头绪,听到同学推荐AI写论文工具后,试用了8个实用AI工具并分享经验。包括AI论文智作、QuillBot、巨鲸写作等,这些工具各有特点,如大多能30分钟生成5万字初稿,覆盖多…

数据血缘图在数据错误追溯中的应用指南

数据血缘图在数据错误追溯中的应用指南 当终端用户发现数据报告或仪表板中存在错误数据时,架构师可以利用数据血缘图进行系统化的“逆向工程”,快速定位故障的系统、转换过程和时间点。 1. 架构师追溯错误的三维定位…

Luogu P10778 BZOJ3569 DZY Loves Chinese II 题解 [ 紫 ] [ Xor Hashing ] [ 线性基 ] [ DFS 树 ]

DZY Loves Chinese II 一道喵喵哈希题。 对于连通性问题,可以考虑对原图建出 DFS 树,然后对于不同的边采取不同的处理方式。在本题中,如果需要把原图割开,那么至少需要存在一条树边,使得经过它的非树边全都被割开…

CSS基础语法 - 指南

CSS基础语法 - 指南2025-11-21 20:24 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-fa…

MineContext:我第一次感觉 AI 真正在“主动帮我管理生活”

MineContext 是一个会在后台记录与整理你日常电脑行为的开源工具。它的体验更像是一种新的信息整理方式:不需要额外输入,你的日常操作本身就是素材我现在一天基本离不开 AI 了。 不是那种“把提示词写得像炼丹”式的…

NCHU OOP-BLOG1-电梯调度-23207329-姚子康 - 翊尘

NCHU OOP-BLOG1-电梯调度程序 正文 1.前言 本次大作业分为三个阶段,每个阶段的最终Boss都是电梯调度程序及迭代,前面是几个关于类设计、正则表达式等等的小题,难度不是很大,但可以锻炼自己的类设计思维能力。 在写…

操作系统的基本概念

操作系统的基本概念1.1.1 操作系统的概念什么是操作系统?操作系统(Operating System,OS)是指控制和管理整个计算机系统的硬件和软件资源,并合理地组织调度计算机的工作和资源的分配;以提供给用户和其他软件方便的接…

「Temp」目录

目录吃吃吃\(\color{orange}{Eon\ 今天吃什么【脱产篇】(已完结)}\) \(\color{orange}{Eon\ 今天吃什么【大学篇】}\)Temp\(\color{magenta}{代码模板}\)Trick\(\color{magenta}{常见错误}\) \(\color{magenta}{智慧…

Linksys HTTPd缓冲区溢出远程代码执行漏洞深度解析

本文详细分析了CVE-2025-60690漏洞,该漏洞存在于Linksys E1200 v2路由器的HTTPd服务中,攻击者可通过特制HTTP请求实现远程代码执行,CVSS评分8.8分,属于高危漏洞。概述 CVE-2025-60690是一个存在于Linksys E1200 v2…

.NET+AI | MEAI | Function Calling 基础(3)

.NET+AI | MEAI | Function Calling 基础 一句话概括 Function Calling 是让大模型能够识别用户意图并返回结构化函数调用指令的能力,而不是模型主动调用函数。 为什么需要Function Calling? 大模型虽然强大,但它只能…

开发智联笔记项目时所遇问题(8)

问题:运行项目文件时报错:D:\Pycharm-workspace\pytorchdemo2\project\static>curl -o static/jsmind.js https://cdn.jsdelivr.net/npm/jsmind@0.4.6/js/jsmind.js % Total % Received % Xferd Average Spee…

高中学习机五大品牌终极横评:优缺点一览,找到最适合你的那一款!

进入高中,学习的难度、强度和节奏都发生了质的变化。面对海量的知识点、频繁的考试以及最终的升学压力,一款得力的学习机或许能成为你逆袭路上的“神助攻”。然而,市面上品牌繁多,功能各异,如何选择?今天,我们就…

NCHU-23207335-面向对象程序设计-BLOG-1

NCHU-23207335-面向对象程序设计-BLOG-1Java 实现电梯调度系统:基于单一职责原则的仿真设计 在日常场景中,电梯的高效运行依赖于合理的调度逻辑。本文将围绕一道经典的电梯调度编程题,从题目解析、类设计、核心逻辑…

开发智联笔记项目时所遇问题(4)

问题如图:从图片中的错误信息可以看出,问题出现在 index.html 第209行,错误是 TypeError: %s enable_sheets to see a function。这通常与 jsmind 的初始化或节点操作有关。 问题诊断与解决方案 1. 检查控制台完整错…

开发智联笔记项目时所遇问题(3)

问题:设置节点不自由 在脑图中显示 [object Object] 是因为节点数据结构不正确。jsMind 期望的节点数据结构与当前的数据格式不匹配。 解决方案 1. 修改创建脑图时的数据结构 在 index.html 中,修改 createMap() 函数…

20251121周五日记

20251121周五日记今日: 1.早上起床去学一新店买了几个面包去实验室,碰见亮子和飞一起分享。打两把炉石看了看何恺明新文章去吃午饭。 2.中午依旧减脂餐,吃完回实验室看看文章睡会觉。 3.下午天气很好,出去遛遛,发…

卡码网94: bellman_ford算法

卡码网94: bellman_ford算法算法思想 1.从边入手,对路径进行松弛操作 2.每次更新最短路径(松弛n-1)次 特:可有负权边,但是不能包含负权回路(可以判是否存在负权回路) https://kamacoder.com/problempage.php?…

2025广东Facebook运营公司推荐 推广、广告、获客、营销一站式解决方案

随着全球化数字贸易的深度发展,Facebook推广已成为企业拓展国际市场的核心引擎。本榜单基于技术专业性、区域服务能力、跨境营销效果三大维度,结合行业权威数据与客户反馈,全面解析2025年广东地区五大Facebook推广服…