信息论(12):Jensen不等式

news/2025/12/8 20:35:00/文章来源:https://www.cnblogs.com/cathybryant/p/19323533

Jensen不等式:如果 f 是一个凸函数,X 是一个随机变量,那么:

$ f(\mathbb{E}[X]) \leq \mathbb{E}[f(X)] $

它的含义是,对于凸函数 f 而言:平均值的函数 ≤ 函数的平均值,如果 f 是凹函数,则不等式取反。

想象一下,函数 f 的形状就像一个碗,例如 f(x) = x²,中间向下,两端向上翘起。

在碗中任意选取两点,比如 x₁ 和 x₂。连接 f(x₁) 和 f(x₂) 的弦(即直线)位于曲线上方。这就是凸性的核心,对于任意介于 0 和 1 之间的 t:

$ f(t x_1 + (1-t) x_2) \leq t f(x_1) + (1-t) f(x_2) $

碗底位于上方拉起的弦的下方。

证明过程如下:首先,从两点开始,就是凸性的定义,它是我们的公理。然后,推广到有限点集,使用归纳法。如果对于 2 个点成立,你可以证明对于 3 个、4 个、… 任意 n 个点也成立,对于权重 $ \lambda_i $之和为 1 :

$ f\left( \sum_{i=1}^n \lambda_i x_i \right) \leq \sum_{i=1}^n \lambda_i f(x_i) $

意思是,无论你如何混合碗中的各个点,混合点的高度 ≤ 各点高度之和。

从有限到连续,计算期望。期望值 E[X] 就像是值的“连续混合”,对于离散随机变量:

$ \mathbb{E}[X] = \sum p_i x_i,\quad \mathbb{E}[f(X)] = \sum p_i f(x_i) $

代入有限情况,完成。对于连续变量,可以用离散点近似并取极限。但原理相同:先在定义域内进行混合,然后再应用 f,其结果比先应用 f 再进行混合要好。

在信息论中,詹森不等式是其背后的原因:熵 H(X) 关于 p(x) 是凸的,詹森不等式控制着边界。它告诉我们,随机性(方差)只会增加描述长度,而不会减少它,因为 $ f(x) = \log(1/x) $ 在概率上是凸函数,所以$ D_{\text{KL}} \geq 0$。

詹森不等式不仅仅是一个不等式,它是信息秩序的守护者。它表明,如果你的测量工具是凸函数,那么先混合后测量的结果总是小于或等于先测量后混合的结果。它确保了信息和代码的世界拥有可靠的结构,不会因为平均值而产生意外。


退一步思考,这里的“n 个点”是什么意思?

我们有点 $ x_1, x_2, ..., x_n $ 和权重 $ \lambda_1, \dots, \lambda_n $ ,满足 $ \sum_{i=1}^n \lambda_i = 1 $,且每个 $ \lambda_i \geq 0 $。

我们要证明:$ f\left( \sum_{i=1}^n \lambda_i x_i \right) \leq \sum_{i=1}^n \lambda_i f(x_i) $ 。

从 2 点到 3 点,我们不能简单地“两两平均”。归纳技巧是,我们将前 n 个点视为一个混合点,将第 (n+1) 个点视为第二个混合点。

让我们以 n=3 为例进行说明:设权重分别为 λ₁、λ₂ 和 λ₃,且三者之和为 1,定义:$ t = \lambda_1 + \lambda_2, \quad 1-t = \lambda_3 $。如果 t = 0 或 t = 1,则结论不成立,因此假设 0 < t < 1。

现在,将 x₁ 和 x₂ 分别用归一化权重 λ₁/t 和 λ₂/t 进行混合:$ y = \frac{\lambda_1}{t} x_1 + \frac{\lambda_2}{t} x_2 $,y 是 x₁ 和 x₂ 的加权平均值。

然后:$\sum_{i=1}^3 \lambda_i x_i = t \cdot y + (1-t) \cdot x_3 $。这样,我们就将原本的三点混合简化为 y 和 $ x_3 $ 之间的两点混合。

两次应用凸性:首先对 x₁ 和 x₂ 应用凸性(因为 f 是凸函数):$ f(y) \leq \frac{\lambda_1}{t} f(x_1) + \frac{\lambda_2}{t} f(x_2) $

之后,对 y 和 $ x_3 $ 应用凸性,权重分别为 t 和 1-t:$ f\left( t y + (1-t) x_3 \right) \leq t f(y) + (1-t) f(x_3) $

最后,将步骤 1 中得到的 f(y) 的界限代入步骤 2:$ f\left( t y + (1-t) x_3 \right) \leq t \left[ \frac{\lambda_1}{t} f(x_1) + \frac{\lambda_2}{t} f(x_2) \right] + (1-t) f(x_3) $

化简 $ t \cdot (\lambda_1/t) = \lambda_1 $,得到:

$ f\left( \lambda_1 x_1 + \lambda_2 x_2 + \lambda_3 x_3 \right) \leq \lambda_1 f(x_1) + \lambda_2 f(x_2) + \lambda_3 f(x_3) $

n=3 时完成。

一般的 n → n+1 归纳步骤:假设对 n 个点都成立。对于权重分别为 $ \lambda_1,\dots,\lambda_{n+1} $ 的 n+1 个点 $ x_1,\dots,x_{n+1} $,总和为 1。令 $ t = \sum_{i=1}^n \lambda_i $ ,若 t=0,则为平凡情况;若 t=1,$ \lambda_{n+1}=0 $,则简化为 n 个点的情况。

定义$ y = \sum_{i=1}^n \frac{\lambda_i}{t} x_i $,即前 n 个点的混合。

然后:$ \sum_{i=1}^{n+1} \lambda_i x_i = t y + (1-t) x_{n+1} $

对 y 和 x_{n+1} 应用凸性:$ f\left( t y + (1-t) x_{n+1} \right) \leq t f(y) + (1-t) f(x_{n+1}) $

根据归纳假设,因为 y 是 n 个点的混合:$ f(y) \leq \sum_{i=1}^n \frac{\lambda_i}{t} f(x_i) $

代入:$ f\left( \sum_{i=1}^{n+1} \lambda_i x_i \right) \leq \sum_{i=1}^{n+1} \lambda_i f(x_i) $

归纳完成。

我们不会在成对树中逐一平均所有点,相反,我们会将除一个点之外的所有点组合成山谷中的一个“复合位置” y,然后将 y 与最后一个点融合。凸性保证了,如果融合两个点成立,并且你知道如何将n个点融合成一个“代表”点,那么再添加一个点就相当于再次融合两个点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/993496.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025年微信公众号排版工具权威评测:哪款编辑器更适合你?

根据《2025新媒体工具生态发展报告》数据显示,目前市面上有超过50款主流公众号排版工具,但用户满意度差距显著。本次评测基于功能完整性、操作效率、AI智能水平、模板丰富度、团队协作及安全性6大核心维度,结合3000…

Beyond Translation: LLM-Based Data Generation for Multilingual Fact-Checking

3 多语言数据集生成(Multilingual Dataset Generation)方法 一、核心目标构建可扩展、高效的自动化流程,生成高质量多语言事实核查数据集,支持英语、西班牙语、德语及低资源语言,包含 “支持(Supports)”“反驳…

道2:汉语和英语是互相独立的系统,学习英语就是学习“切换系统”

……汉语系统VS英语系统 语音: 1、元音的“松紧不分”,/i/和/i:/ 2、辅音的“画蛇添足” 3、音的“缺失替代” 4、节奏混淆,英语重音计时,汉语音节计时 语法: 英语是屈折语,通过单词形态变化传递很多信息。 汉语是…

go缓存设计 redis 发布订阅

go缓存设计 redis 发布订阅一般缓存 有内存缓存, 没有就读redis, redis没有就读tidb;如何防止缓存穿透,这里我们用golang.org/x/sync/singleflight解决,还有缓存更新,比如多个节点如何更新,这里借用redis 发布订…

npm几个实用命令

现在前端开发基本每天都会用到npm命令,最近在解决安全团队报告的安全风险时,发现了几个npm非常实用的命令,特记录下来...前言 最近接到公司安全团队的项目风险表格,列出了当前前端项目的一些安全风险,大概有190多…

产品研发管理 : 构建世界一流的产品研发管理体系

针对大部分客户分不清R&D 中R( 技术开发) 和D( 产品开发) 的区别,面临着研发周期长,需求不清晰,公司越做越大,却越来越不赚钱,越来越缺少核心竞争能力,研发人员越来越多,越来越难管理等问题。中国的大部分技…

iOS 知识点 - 多线程总结(GCD/Operation/Swift Concurrency/线程安全/线程通信)

前景回顾 简单回顾四个概念:进程 vs 线程进程:是操作系统资源分配的最小单位每个 App 通常就是一个进程,进程之间相互隔离,拥有各自的虚拟内存空间、文件描述符、沙盒目录。线程:是 CPU 任务调度的最小单位每个进…

前端实现页面截图及截图内容包含跨域图片时的处理

项目中遇到需要实现指定位置的截图,采取使用依赖 html2canvas 实现。 参考:https://html2canvas.hertzen.com/ 一、实现步骤: 1、下载依赖或者使用官方js文件链接,本文使用的js链接; 2、代码 style .screen-box {…

2025.12.8

今天练习了前后端的连接一起的增删改查

(最新)2025实测!这11款免费降AI率工具,哪款能救你论文?

(最新)2025实测!这11款免费降AI率工具,哪款能救你论文?一篇AI率高达92%的论文摘要,经过专业工具处理后竟能降至个位数,而某些免费工具却可能把它改得“面目全非”。选择正确的降AI工具,关乎你的论文命运。 凌晨…

LLM应用剖析: 小红书AI图文生成器-红墨

本文介绍了小红书的一键图文生成平台,并提供了系统的基本执行流程及原理。同时分享了本人基于本地部署后,生成的图文效果,眼过千遍不如手过一遍,实践方能出真知。1. 背景花了近一周时间,深入研究了Github近几天比…

openSIS 8.0 SQL注入漏洞技术分析与利用

本文详细分析了openSIS社区版8.0中存在的SQL注入漏洞(CVE-2021-40617),提供了完整的漏洞利用证明和复现步骤,涉及通过ForgotPassUserName.php参数注入的具体攻击向量。漏洞标题: openSIS Community Edition 8.0 - …

【把Linux“聊”明白】进程的概念与状态 - 详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

17.Mybatis之代理对象的执行

1.调用 Mapper 方法时,所有请求都会转发到 MapperProxy.invoke(),这是整个流程的入口: public class MapperProxy<T> implements InvocationHandler, Serializable {private final SqlSession sqlSession;pri…

哥大与某机构共建AI研究中心,五年投资500万美元

文章宣布了某机构与哥伦比亚大学工程学院合作,在纽约创立人工智能技术中心。该中心将获得500万美元的五年期资助,用于支持博士生奖学金、跨学科研究项目以及公开研讨会,旨在推动人工智能技术的前沿创新与应用普及。…

中国电子学会全国机器人技术等级考试(一级)2019年12月 - 详解

中国电子学会全国机器人技术等级考试(一级)2019年12月 - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Co…

道1:“知识型英语”和“本能型英语”都要学

两种记忆系统: ……陈述性记忆:事实and概念,存储关于……的知识 ……程序性记忆:技能and习惯,存储如何做的知识 两种英语(都要学): ……知识型英语:知识记忆模式,多静态输入。核心策略:理解加记忆、语法当公…

IDEA源码阅读神器-Diagram专业的工具

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

读书笔记 XILINX ug1137-Zynq UltraScale+ MPSoC Software Developer Guide 软件开发者指南 Chapter7

读书笔记 XILINX ug1137-Zynq UltraScale+ MPSoC Software Developer Guide 软件开发者指南 Chapter7目录前言Chapter 7: System Boot and Configuration 系统引导和配置7.1 Boot Process Overview 引导过程概述7.2 Bo…

2025年苗木批发基地供应商口碑榜:前十强深度解析,丝棉木/金森女贞/青叶复叶槭/红叶李/国槐/白蜡/无刺枸骨球苗木批发基地供应商排行榜单

随着城乡绿化建设标准提升与生态修复项目持续推进,苗木产业作为基础支撑环节,其供应商的综合实力与市场口碑愈发受到行业关注。一个可靠的苗木批发基地,不仅需要具备丰富的产品矩阵,更需在种植规范化、品质稳定性及…