音视频学习(七十六):熵编码 - 实践

news/2026/1/23 17:33:58/文章来源:https://www.cnblogs.com/tlnshuju/p/19523413

音视频学习(七十六):熵编码 - 实践

2026-01-23 17:29  tlnshuju  阅读(0)  评论(0)    收藏  举报

熵编码在视频压缩中的作用

在视频压缩体系中,熵编码是最后一道压缩关卡,其主要任务是:

在不再引入任何失真的前提下,进一步减少码率

一个典型的视频编码流程为:

预测 → 变换 → 量化 → 熵编码

其中:

  • 预测、变换、量化负责消除时域、空域冗余并进行有损压缩
  • 熵编码只做无损压缩,消除统计冗余

可以说:

熵编码决定最终码流是否“足够小”,但不影响画质

信息熵与熵编码基础

1. 信息熵的概念

熵(Entropy)源自信息论,由香农提出,用于衡量信息的不确定性:

在这里插入图片描述

含义:

熵编码的目标是:

让码字长度接近符号的理论最小熵值

2. 为什么视频编码适合熵编码

经过预测、变换和量化后,视频数据具有以下特征:

  • 大量 0 或小整数
  • 符号分布极不均匀
  • 相邻符号强相关

这些特性非常适合熵编码算法进行压缩。

熵编码的基本思想

熵编码遵循的核心原则是:

高概率符号用短码表示,低概率符号用长码表示

典型例子:

熵编码不改变符号的值,只改变表示方式。

常见熵编码方法

1. 游程编码(RLE)

原理

在视频编码中的应用

特点

2. 哈夫曼编码(Huffman Coding)

原理

  • 基于符号概率构建最优前缀码
  • 短码表示高概率符号

优点

  • 编码效率高
  • 实现相对简单

缺点

  • 码字长度必须是整数比特
  • 对概率变化不够灵活

应用

  • MPEG-2
  • JPEG
  • H.264 CAVLC 中的部分表

3. 算术编码(Arithmetic Coding)

原理

优点

缺点

应用

H.264 中的熵编码

H.264 提供了两种熵编码方式:

编码方式特点应用
CAVLC简单、速度快Baseline
CABAC压缩率高Main / High

1. CAVLC(Context-Adaptive Variable Length Coding)

核心思想

  • 基于上下文的可变长编码
  • 主要针对 4×4 变换块

编码内容包括:

  • 非零系数个数
  • 拖尾 1 的个数
  • 系数幅值
  • 零游程

编码流程

Zigzag 扫描→ 统计非零系数→ 编码 Trailing Ones→ 编码 Level→ 编码 Run Before

特点

优点:

  • 计算复杂度低
  • 无算术编码
  • 硬件实现简单

缺点:

  • 压缩效率有限
  • 对高分辨率不友好

2. CABAC(Context-Adaptive Binary Arithmetic Coding)

设计目标

  • 最大限度压缩码率
  • 利用上下文建模

核心组成

CABAC 包含三个关键步骤:

  1. 二值化(Binarization)
  2. 上下文建模(Context Modeling)
  3. 算术编码(Arithmetic Coding)

二值化

将非二值符号拆成二进制串,例如:

  • Unary
  • Truncated Unary
  • Exp-Golomb

上下文建模

算术编码

  • 使用二进制算术编码器
  • 动态更新概率模型

CABAC 优势

缺点:

H.265 / HEVC 中的熵编码

1. 统一使用 CABAC

HEVC 移除了 CAVLC:

2. HEVC 的改进点

  • 更精细的上下文模型
  • 更少的 bin 数
  • 更高并行度支持

结果:

在相同画质下,HEVC 比 H.264 节省约 30%~40% 码率

AV1 中的熵编码

AV1 使用的是:

特点:

AV1 的熵编码:

熵编码与上下文建模

上下文建模是熵编码成功的关键:

常见上下文来源:

  • 邻近块的非零系数数目
  • 预测模式
  • 帧类型
  • 运动矢量大小

好的上下文模型可以:

  • 提高概率预测准确度
  • 减少平均码字长度

熵编码对性能的影响

1. 压缩效率

  • CABAC > CAVLC > Huffman
  • AV1 ANS 目前最优

2. 计算复杂度

3. 实时性权衡

在实时编码场景:

  • 可牺牲部分压缩率
  • 换取编码速度和低延迟

总结

熵编码是视频压缩中:

一句话总结:

预测与量化决定“剩多少”,熵编码决定“怎么装”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1205924.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026年1月光伏支架厂家推荐榜单:C型钢/Z型钢/U型钢/锌铝镁/热镀锌/跟踪式光伏支架及车棚、水槽、运维踏板、螺旋地桩全品类深度解析与选购指南

2026年1月光伏支架厂家推荐榜单:C型钢/Z型钢/U型钢/锌铝镁/热镀锌/跟踪式光伏支架及车棚、水槽、运维踏板、螺旋地桩全品类深度解析与选购指南 随着全球能源结构向绿色低碳转型的加速,光伏产业作为可再生能源的主力军…

2026年皮肤科医生权威推荐:10款高口碑医美术后修复面膜,光子嫩肤激光术防反黑

《中国医美皮肤修复白皮书(2025)》指出,医美术后皮肤修复是确保治疗效果与患者满意度的核心环节,其中“即时褪红、屏障修复、防反黑”是三大关键需求。数据显示,我国医美术后红斑持续时间平均5.2天,色素沉着发生…

2026国内最新红外光谱仪定制中心top5推荐!上海等地顶尖服务商权威榜单发布,技术创新与本土化服务双驱动助力科研与工业升级

随着工业4.0与科研精细化需求的深度融合,红外光谱仪作为物质定性定量分析的核心工具,正朝着国产化、智能化、多场景化方向加速迭代。据中国仪器仪表行业协会2025年度报告显示,国内红外光谱仪市场规模突破50亿元,但…

JavaStreamAPI的性能审视,优雅语法背后的隐形成本与优化实践

在协助某电商团队进行性能问题排查时,我们遇到一个典型场景:对十万条订单数据进行处理(筛选金额大于1000元的订单并计算平均价格)。团队最初使用JavaStreamAPI编写的实现耗时约280毫秒,而一位经验丰富的同事改用传统循…

2026年窗帘加盟品牌推荐:现代简约窗帘加盟、新中式窗帘加盟、全屋定制窗帘加盟、一站式窗帘加盟、成品帘窗帘加盟等公司品牌赋能创业之路

在家居软装行业持续扩容的当下,窗帘加盟凭借刚性需求与灵活的经营模式,成为创业者入局的热门赛道。选择具备核心竞争力与完善扶持体系的品牌,是创业成功的关键。本文结合品牌实力、技术积淀、市场口碑等维度,筛选出…

2026年1月徐州市优质民办高中学校综合评估与选型指南

在徐州市教育资源持续优化、家庭教育需求日益精细化的背景下,民办高中已成为多元化教育供给体系中的重要一环。本文基于最新行业数据与市场调研,旨在为寻求优质民办高中学位的家庭提供一份数据驱动的综合选购参考。报…

VirtualBox虚拟机下vscode无法正常更新和打开插件商店的办法

最近偶然发现我在虚拟里的vscode无法更新和安装插件。。。 debian uos下虚拟机不能更新太不理想了折腾来折腾去,发现都没啥用然后。。。。。我把虚拟机的网卡由NAT改成了桥接。。。然后 一切都恢复正常了。。。正常了。。。。。

API 网关解决方案选型:Kong 和 Spring Cloud Gateway

Kong 和 Spring Cloud Gateway 都是 API 网关解决方案,但它们不是简单的替代关系,而是各有侧重,适用于不同的技术栈和场景。 简单来说: Spring Cloud Gateway 是 Spring Cloud 生态的 云原生 API 网关,深度集成 Spri…

Spring Cloud Gateway 网关自动路由机制详解

Spring Cloud Gateway 自动路由揭秘:为什么没有配置也能工作? 引言 在使用 Spring Cloud Gateway 时,你可能会发现一个有趣的现象:在 application.yml 中明明没有配置任何路由规则,但服务却可以通过网关正常访问。这…

Spring Cloud @EnableDiscoveryClient 注解详解

一、概述 1.1 基本定义 EnableDiscoveryClient 是 Spring Cloud 中用于启用服务发现客户端功能的核心注解。它使得应用程序能够向服务注册中心注册自己,同时发现其他服务。 Target(ElementType.TYPE) Retention(RetentionPolicy.RUNTIME) Documented Inherited I…

Kubernetes 基础概念面试题详解

一、核心概念理解 1. 什么是Kubernetes?它解决了什么问题? 答案: Kubernetes(K8S)是一个开源的容器编排平台,用于自动化部署、扩展和管理容器化应用程序。 解决的核心问题: 服务发现与负载…

AI设计:用技术提升创意效率的实战指南

AI设计的本质,是通过机器学习与计算机视觉技术,将设计中的重复性劳动技能门槛环节转化为自动化流程,从而让创意从业者从工具操作中解放,聚焦于更具价值的策略性创意——这不是替代人类,而是放大人类创意的价值。 从技术…

Kubernetes 网络与服务发现面试题详解

一、网络模型基础 1. Kubernetes的网络模型有哪些基本要求? 答案: Kubernetes网络模型基于以下核心原则: 所有Pod可以相互通信 不使用NAT,Pod之间可以直接通过IP通信跨节点的Pod也能直接访问简化了网络拓扑,避免端…

解耦指导+保持先验:北邮团队实现大模型“零标注“域内高保真生成

北京邮电大学团队提出"指导解耦先验保持机制",将扩散模型的条件指导解耦为领域指导和控制指导两部分,通过预训练模型保持控制指导能力,用无文本UNet学习领域知识。该方法仅需领域图像数据,在人脸、动物和瓷器三个领域测…

什么是大模型微调(Fine-Tuning)?大模型微调技术详解:提升模型性能的关键方法

大模型微调是在预训练模型基础上,利用少量特定领域数据继续训练,使其适应特定任务。优势包括提升任务表现、防止过拟合、降低成本和增强领域适应性。技术路线分为参数规模划分的全参微调(FPFT)和参数高效微调(PEFT),以及训练流程划分的监督微…

大模型智能体化推理:LLM如何成为自主智能体的全面解析

本文系统综述了智能体化推理(Agentic Reasoning)范式,探讨大语言模型如何从静态推理转变为与环境持续交互的自主智能体。文章从三个维度分析:基础智能体推理(规划、工具使用)、自我演进智能体推理(通过反馈自适应)和集体多智能体推理(多智能体协作)&…

编译器选项-(工作总结)

1.编译器选项 本文总结在编译器中使用的变量: 2.编译器 2.1 Mingw 和 GUN 相关部分 含义 说明-W 警告(Warning)选项前缀 所有控制警告的编译器选项都以 -W 开头。dangling-else 特定的警告名称 指代代码中可能引起歧…

HORIBA MEXA-324M:双组分汽车尾气测量仪技术说明 - 教程

HORIBA MEXA-324M:双组分汽车尾气测量仪技术说明 - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas…

2026年四川夜景照明工程哪家好?众奇光彩的亮化工程为何脱颖而出?

在城市更新与夜间经济蓬勃发展的双重驱动下,夜景照明工程已从单纯的“照亮”功能,跃升为塑造城市形象、激活文旅消费、提升商业价值的重要载体。尤其在四川,随着成渝地区双城经济圈建设提速,市政亮化、文旅夜游、商…

强烈安利10个AI论文平台,自考学生轻松搞定毕业论文!

强烈安利10个AI论文平台,自考学生轻松搞定毕业论文! 自考论文写作的救星,AI工具如何改变你的学习节奏 对于自考学生来说,毕业论文不仅是学业的终点,更是能力与毅力的考验。然而,面对繁重的写作任务、复杂的…