【LLIE专题】基于事件相机照度估计的暗光增强方案

在这里插入图片描述

Low-Light Image Enhancement using Event-Based Illumination Estimation(2025,CVPR)

  • 专题介绍
  • 一、研究背景
  • 二、RETINEV方法
    • 1.事件相机
    • 2. 本文方案
      • 2.1 事件时间戳与光照的物理关系
      • 2.2 总体架构:Retinex 理论驱动的分解
      • 2.3 时间到光照(T2I)模块:低光退化与光照调控
      • 2.4 光照辅助反射增强(IRE):交叉模态注意力
      • 2.5 损失函数
  • 三、实验结果
      • 1. 实验数据集
      • 2. 对比实验
      • 3.消融实验
  • 四、总结
  • 五、个人思考

本文将对 Low-Light Image Enhancement using Event-Based Illumination Estimation,这篇暗光增强算法进行讲解。参考资料如下:

[1] RETINEV 文章]


专题介绍

在低光照环境下,传统成像设备往往因画面昏暗、细节丢失而受限。LLIE(低照度暗光增强)技术应运而生,它通过提升图像亮度、对比度,减少噪点并恢复色彩细节,让暗夜变得清晰可见。

LLIE技术从传统方法如直方图均衡化、Retinex模型等起步,近年来借助深度学习,尤其是卷积神经网络(CNN),GAN模型,扩散模型实现了质的飞跃。这些算法能自动学习图像特征,精准处理低光照图像,效果显著优于传统技术。

本专题将聚焦LLIE技术的核心原理、应用案例及最新进展,让我们一起见证LLIE如何点亮暗夜,开启视觉新视界!欢迎一起探讨交流!

系列文章如下
【1】ZeroDCE
【2】HVI
【3】CLIP-LIT
【4】GLARE
【5】Retinexformer


一、研究背景

  • 低光图像增强的挑战 :在低光照条件下拍摄的图像通常存在亮度不足、噪声明显、对比度低和细节丢失等问题,这会限制计算机视觉算法在智能驾驶、安防监控和医疗成像等领域的应用效果,因此需要有效的低光图像增强方法来提升图像质量。
  • 传统方法的局限 :许多传统方法通过图像本身信息增强低光图像,但往往会导致噪声放大或细节丢失。

低质量单图的有效信息受限,这直接限制了增强的幅度和精度。因此现在有不少多模态图像增强方法,利用额外的参考信息来辅助图像增强,例如深度图、红外图以及事件数据(由事件相机输出)等等。

本文提出了一种基于事件相机的低光图像增强方法 RETINEV,通过利用事件相机的时间映射事件估计光照信息,并结合 Retinex 理论实现了对低光图像的高效增强。

二、RETINEV方法

1.事件相机

首先介绍一下什么是事件相机

  • 事件相机是一款新型传感器。不同于传统相机拍摄一幅完整的图像,事件相机拍摄的是“事件”,可以简单理解为“像素亮度的变化”,即事件相机输出的是像素亮度的变化情况。事件相机英文名为:Event-based Camera,或简称为Event Camera,缩写为EB。有时也称作DVS(Dynamic Vision Sensor “动态视觉传感器”)、DAVIS(Dynamic and Active-Pixel Vision Sensor)等。

  • 事件相机最基本的原理,即:当某个像素的亮度变化累计达到一定阈值后,输出一个事件。这里强调几个概念:
    a) 亮度变化:说明事件相机的输出和变化有关,而与亮度的绝对值没有关系;
    b) 阈值:当亮度变化达到一定程度时,将输出数据,这个阈值是相机的固有参数。
    下面重点解释什么是一个“事件”。事件具有三要素:时间戳、像素坐标与极性。一个事件表达的是“在什么时间,哪个像素点,发生了亮度的增加或减小”。

  • 当场景中由物体运动或光照改变造成大量像素变化时,会产生一系列的事件,这些事件以事件流(Events stream)方式输出。事件流的数据量远小于传统相机传输的数据,且事件流没有最小时间单位,所以不像传统相机定时输出数据,具有低延迟特性。下面的动图揭示了事件相机与传统相机的成像的不同。
    在这里插入图片描述
    动图:左侧为有一个黑色斑块的圆盘,匀速旋转时,右上方的传统相机会定时拍摄完整的图像,下方事件相机的输出会仅输出变化,即黑斑的运动。当圆盘不转时,传统相机依旧傻傻的拍摄图像,而事件相机不会产生任何输出。

  • 事件相机的优势与不足 :事件相机具有高动态范围和出色的低光响应能力,且仅在场景亮度变化时触发事件,避免了冗余信息的传输和处理。但现有的基于事件的方法主要依赖于运动事件来增强边缘纹理,而未充分利用事件相机的高动态范围和低光响应性,尤其在静态场景中性能受限,且缺乏对光照的全局估计能力。

2. 本文方案

在这里插入图片描述

2.1 事件时间戳与光照的物理关系

事件相机通过像素强度变化触发事件,其时间戳隐含光照信息。作者基于光电转换模型,建立光照强度E与首个正事件时间戳 t fpe t_{\text{fpe}} tfpe的关系: η ⋅ E ⋅ A ⋅ t fpe = C ⋅ U thd 2 2 \eta \cdot E \cdot A \cdot t_{\text{fpe}} = \frac{C \cdot U_{\text{thd}}^2}{2} \quad ηEAtfpe=2CUthd2其中, η \eta η为光电转换效率,A为像素面积,C和 U thd U_{\text{thd}} Uthd为像素电容与阈值电压。简化后得: E = k t fpe , k = C ⋅ U thd 2 2 η ⋅ A E = \frac{k}{t_{\text{fpe}}} \quad , \quad k = \frac{C \cdot U_{\text{thd}}^2}{2\eta \cdot A} E=tfpek,k=2ηACUthd2该公式表明光照强度与时间戳成反比,为后续时间 - 光照(T2I)模块提供物理基础。

2.2 总体架构:Retinex 理论驱动的分解

基于 Retinex 理论,观测图像S分解为反射率R(物体固有属性)和光照I(环境变量): S = R ⋅ I S = R \cdot I \quad S=RI传统方法仅从低光图像估计I,易受噪声干扰。RETINEV 引入时间映射事件估计高精度光照 I ^ \hat{I} I^,并通过交叉模态注意力优化反射率 R ^ \hat{R} R^ I ^ = F T2I ( t fpe ; Θ 1 ) , R ^ low = F IRE ( R low , I ^ ; Θ 3 ) \hat{I} = \mathcal{F}_{\text{T2I}}(t_{\text{fpe}}; \Theta_1) \quad , \quad \hat{R}_{\text{low}} = \mathcal{F}_{\text{IRE}}(R_{\text{low}}, \hat{I}; \Theta_3) \quad I^=FT2I(tfpe;Θ1),R^low=FIRE(Rlow,I^;Θ3)最终增强图像为: S ^ low = I ^ ⋅ R ^ low \hat{S}_{\text{low}} = \hat{I} \cdot \hat{R}_{\text{low}} \quad S^low=I^R^lowT2I 模块包含去噪网络、非线性映射(MLP)和 Gamma 编码,确保事件时间戳与 RGB 光照对齐。

2.3 时间到光照(T2I)模块:低光退化与光照调控

  • 低光退化模型(LLDM)模拟真实场景中事件相机的退化特性,使训练数据更贴近实际场景,提升模型对低光事件的鲁棒性。退化特性包括:
    • 空间域: 模糊(衍射效应)、下采样(传感器限制)、泊松 - 高斯噪声(暗电流);
    • 时间域: 时间戳延迟(与 t fpe t_{\text{fpe}} tfpe正相关)。
      LLDM 通过数学建模将这些退化注入合成训练数据,确保模型学习到低光事件的真实分布,避免仅适配理想条件下的事件数据。在训练阶段,LLDM 对理想事件时间戳 t fpe t_{\text{fpe}} tfpe添加延迟和噪声,使 T2I 模块学会从 “脏数据” 中提取光照信息。
  • 光照调节系数 β \beta β实现亮度可控性: t norm = t fpe + β max ⁡ ( t fpe ) + β t_{\text{norm}} = \frac{t_{\text{fpe}} + \beta}{\max(t_{\text{fpe}}) + \beta} \quad tnorm=max(tfpe)+βtfpe+β通过调整 β \beta β,可线性缩放光照强度,同时保持反射率不变。
    应用场景:不同用户或场景对亮度的偏好不同(如安防需要高亮、艺术场景需要柔和),β 允许手动 / 自动调节最终增强图像的整体亮度(下图可视化了 β 对 I 的影响)。
    在这里插入图片描述
    根据 Retinex 理论,反射率R是物体固有属性,与光照无关。β 仅作用于光照分量 I ^ \hat{I} I^,反射率 R ^ low \hat{R}_{\text{low}} R^low的计算完全基于图像本身和事件估计的光照先验,不受 β 影响。实验也验证了这一点:上图的反射率可视化显示,不同 β 值下 R ^ low \hat{R}_{\text{low}} R^low的灰度分布一致,证明了其不变性。

2.4 光照辅助反射增强(IRE):交叉模态注意力

传统 Retinex 方法仅增强光照,忽略反射率优化。RETINEV 设计交叉模态注意力,利用光照先验提升反射率细节: Attention ( Q R , K I , V I ) = V I ⋅ softmax ( Q R ⊤ K I d k ) \text{Attention}(Q_R, K_I, V_I) = V_I \cdot \text{softmax}\left(\frac{Q_R^\top K_I}{\sqrt{d_k}}\right) \quad Attention(QR,KI,VI)=VIsoftmax(dk QRKI)其中,查询 Q R Q_R QR来自反射率特征,键值对 ( K I , V I ) (K_I, V_I) (KI,VI)来自光照特征。通过转置 Q R Q_R QR,将计算复杂度从 O ( h 2 w 2 ) O(h^2w^2) O(h2w2)降至 O ( c 2 ) O(c^2) O(c2)(c为通道数),兼顾长距离依赖与效率。

2.5 损失函数

重建损失(对齐增强图像与正常光照图像):
L recon = ∥ I ^ ⋅ R ^ low − S normal ∥ 1 + ∥ I ^ ⋅ R normal − S normal ∥ 1 \mathcal{L}_{\text{recon}} = \|\hat{I} \cdot \hat{R}_{\text{low}} - S_{\text{normal}}\|_1 + \|\hat{I} \cdot R_{\text{normal}} - S_{\text{normal}}\|_1 \quad Lrecon=I^R^lowSnormal1+I^RnormalSnormal1
反射不变损失(强制反射率跨光照一致):
L R = ∥ R low − R normal ∥ 1 + ∥ R ^ low − R normal ∥ 1 \mathcal{L}_R = \|R_{\text{low}} - R_{\text{normal}}\|_1 + \|\hat{R}_{\text{low}} - R_{\text{normal}}\|_1 \quad LR=RlowRnormal1+R^lowRnormal1
感知损失(基于预训练网络的结构相似性),最终加权求和。

总之,通过物理建模 - 架构设计 - 优化约束的闭环,实现了基于事件时间戳的高精度光照估计,并结合 Retinex 理论与交叉模态注意力,突破了传统方法依赖运动事件的局限。

三、实验结果

1. 实验数据集

  • 合成数据集(训练 + 验证):
    LOL v1/v2:包含真实低光图像(LOL v1)和合成 / 真实低光视频(LOL v2),分辨率 600×400/384×284,用于基础性能对比。
    SDSD:室内外低光视频数据集,分辨率 512×960,验证跨场景泛化性。
  • 自建真实数据集 EvLowLight:
    在这里插入图片描述

采集方案:共享镜头分光棱镜系统(如上图),同步 DVS(1280×720)和 RGB 相机(1280×1024),覆盖 2.5–6 lux 极端低光场景(60 组,每组 3 曝光图像 + 时间映射事件 + 运动事件)。
独特性:首个同时包含 时间映射事件和运动事件 的数据集,支持事件基方法的真实场景评估。
真值生成:通过多曝光融合生成 HDR 参考图。

2. 对比实验

  1. 合成数据集定量对比
    在这里插入图片描述
  • 指标:PSNR、SSIM,对比 11 类 SOTA 方法(图像基 / 事件基)。
  • 优势:
    图像基方法:Retinexformer(25.16 dB)→ RETINEV(28.60 dB),PSNR+3.44 dB(LOL v1),SSIM+0.312。
    事件基方法:EvLight(28.52 dB)→ RETINEV(33.65 dB,SDSD 室内),PSNR+5.13 dB,验证时间映射事件优于运动事件。
  • 效率:仅 3.44M 参数,Flops 184.6G,远低于 EvLight(22.73M 参数,438.5G Flops)。
  1. 真实数据集对比
    在这里插入图片描述
  • 定量指标:
    PSNR* 15.39,超次优方法 EvLight(14.51)+0.88 dB。
    非参考指标 PIQE 9.41(越低越好),显著优于 Retinexformer(19.55),证明视觉自然性。
  • 定性结果:
    在这里插入图片描述
    图像基方法(如 RetinexNet):暗区噪点严重,高光过曝(上图 第一列)。
    运动事件方法(EvLight):边缘伪影(如雕塑暗部 “鬼影”),对比度失衡。
    RETINEV:效果最佳。

3.消融实验

在这里插入图片描述

  • 时间映射事件有效性:纯图像基(16.98 dB)→ 加入事件(26.96 dB),PSNR+9.98 dB,证明事件光照先验的核心作用。
  • LLDM 退化模型有效性:无 LLDM(27.25 dB)→ 有 LLDM(27.83 dB),PSNR+0.58 dB,验证低光事件建模的有效性。
  • IRE 模块设计有效性:
    简单融合(Add/Concat/Multiply)→ 交叉模态注意力(28.60 dB),PSNR+0.47~0.62 dB,证明注意力机制对长距离依赖的优化。

四、总结

本文提出的 RETINEV 框架 颠覆传统事件基方法的技术路径,核心创新点如下:

  • 光照估计的物理建模:利用事件相机对快门开合的响应(时间映射事件),建立光照强度与首正事件时间戳的反比关系: E = k t fpe E = \frac{k}{t_{\text{fpe}}} E=tfpek
    通过 T2I 模块(时间到光照转换),将时间戳转化为高精度光照图,突破运动事件仅含边缘信息的局限。
  • 跨模态协同的 Retinex 分解:基于 Retinex 理论 ( S = R ⋅ I ) (S = R \cdot I) (S=RI),设计 IRE 模块(光照辅助反射增强),通过交叉模态注意力,利用光照先验优化反射率,实现纹理细节的无伪影恢复。
  • 贴近真实的低光数据模拟:提出 LLDM 低光退化模型,模拟时间戳延迟、暗电流噪声等特性,生成与真实低光事件分布一致的合成数据,提升模型泛化能力。
  • 开辟事件相机在低光增强中的新方向:从 “运动边缘辅助” 到 “光照 - 反射率协同优化”。轻量化设计(3.44M 参数)为嵌入式设备部署提供可能。

五、个人思考

传统事件基方法(如 EvLight)仅将事件视为 “运动边缘检测器”,其性能受限于场景动态性 —— 无运动则失效。而本文通过时间映射事件的物理建模$ ( E = k t fpe ) (E = \frac{k}{t_{\text{fpe}}}) E=tfpek,将事件相机从 “辅助传感器” 提升为 “光照测量工具”,这一转变具有深远意义:

  • 跨任务迁移价值:光照估计是计算机视觉的基础问题(如 HDR 成像、光度立体),本文方法可迁移至其他依赖光照先验的任务,例如单图像深度估计。
  • 挑战:当前依赖机械快门生成时间映射事件,限制了实时性(2 ms 同步延迟),如何通过软件算法模拟透射率调制(如虚拟快门)是值得探索的方向。

感谢阅读,欢迎留言或私信,一起探讨和交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/82025.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

腾讯云媒体AI解码全球视频出海智能密码

当短剧平台撞上多语种字幕困境,当直播电商遭遇文化审核危机,当经典影视困于格式壁垒——这些内容出海的难题,正被腾讯云媒体AI的智能引擎逐个破解。从东南亚的直播卡顿到中东的宗教符号雷区,从老片的低清画质到元宇宙的渲染瓶颈&a…

Spring Boot 多租户架构实现:基于上下文自动传递的独立资源隔离方案

一、核心设计思想 通过线程上下文自动传递租户ID,结合动态数据源路由和中间件连接工厂,实现MySQL、Redis、RocketMQ的完全自动化资源隔离。关键设计如下: #mermaid-svg-ZjXCGSWoCuNFMIch {font-family:"trebuchet ms",verdana,aria…

参与开发的注意事项

1.开发期间,不要擅自修改架构的内容 使用技术官发的项目文件夹来开发,而不是自己建立项目, 否则会导致环境不统一 架构内容:(不能更改) 1.类型定义,全局变量声明 2.函数申明(函数名称…

产业互联网+三融战略:重构企业增长密码

产业互联网时代:用"三融"重构企业增长飞轮 在产业互联网浪潮下,企业面临资源分散、资金短缺、人才难聚的三重挑战。本文提出的"融人、融资、融资源"顶层设计,正为新时代企业构建增长新引擎。 一、三级合伙人体系&#x…

【JavaScript异步编程终极指南】从回调地狱到Async/Await的实战突围

目录 🌍 前言:技术背景与价值💔 当前技术痛点🛠 解决方案概述👥 目标读者说明🔍 一、技术原理剖析🧠 核心作用讲解🧩 关键技术模块说明⚖️ 技术选型对比 💻 二、实战演示…

国标GB28181设备管理软件EasyGBS视频监控系统打造工厂可视化监管场景解决方案

一、引言​ 随着工厂规模扩大、生产流程复杂化,传统管理模式已难以满足精细化运营需求。当前部分工厂视频监控系统存在设备协议不兼容、功能分散等问题。EasyGBS视频监控系统基于GB28181标准协议,以高兼容性架构实现设备统一接入,集成视频全…

# 终端执行 java -jar example.jar 时(example.jar为项目jar包)报错:“没有主清单属性” 的解决方法

终端执行 java -jar example.jar 时(example.jar为项目jar包)报错:“没有主清单属性” 的解决方法 在Java中,一个JAR文件必须包含一个主清单属性(Main-Class属性)才能在命令行中直接运行。如果你在尝试运行…

使用 mutt 发送邮件:Linux 下轻量高效的命令行邮件工具

文章目录 一、安装 mutt二、配置 .muttrc三、发送一封简单邮件四、发送给多个收件人五、发送附件六、临时设置发件人七、脚本示例:八.结语 在 Linux 或类 Unix 系统中,mutt 是一款经典且强大的命令行邮件客户端(MUA,邮件用户代理&…

OceanBase 开发者大会,拥抱 Data*AI 战略,构建 AI 数据底座

5 月 17 号以“当 SQL 遇见 AI”为主题的 OceanBase 开发者大会在广州举行,因为行程的原因未能现场参会,仍然通过视频直播观看了全部的演讲。总体来说,这届大会既有对未来数据库演进方向的展望,也有 OceanBase 新产品的发布&#…

为 Spring Boot 应用程序构建 CI/CD 流水线

为 Spring Boot 应用程序创建构建/部署流水线涉及多个步骤,而 Jenkins 可以作为强大的工具来自动化这些流程。在本教程中,我们将指导您为托管在 GitHub 上的 Spring Boot 应用程序设置流水线,使用 Jenkins 构建该应用程序,并将其部署到 Amazon Elastic Kubernetes Service …

BI是什么意思?一文讲清BI的概念与应用!

目录 一、BI 是什么意思 1. BI 的定义 2. BI 的发展历程 3. BI 的核心组件 二、BI 的应用场景 1. 销售与市场营销 2. 财务管理 ​编辑3. 人力资源管理 4. 生产与运营管理 ​编辑三、选择合适的 BI 工具 1. 考虑企业的需求和规模 2. 评估工具的功能和性能 3. 关注工…

磁盘分区与挂载——笔记

1.磁盘分区 磁盘分区是将物理磁盘划分为多个逻辑区域的过程。每个分区可视为独立的存储单元,拥有独立的文件系统,可安装不同操作系统或存放不同类型数据。例如,将硬盘分为系统盘(存放操作系统)、数据盘(存…

如何让 Google 收录 Github Pages 个人博客

版权归作者所有,如有转发,请注明文章出处:https://cyrus-studio.github.io/blog/ 如何确认自己的网站有没有被 google 收录 假设网址是:https://cyrus-studio.github.io/blog 搜索:site:https://cyrus-studio.github…

HarmonyOS Next 关键资产的解释

关键资产的安全存储与管理:HarmonyOS Asset Store Kit 深度解析 一、关键资产的定义与重要性 关键资产(Critical Asset)是指应用运行过程中涉及的短敏感数据,包括但不限于用户密码、身份令牌(Token)、银行…

机器学习(12)——LGBM(1)

文章目录 LightGBM算法详解1. 算法背景2. 核心创新2.1 基于直方图的决策树算法2.2 单边梯度采样(GOSS)2.3 互斥特征捆绑(EFB) 3. 算法细节3.1 树生长策略3.2 特征并行与数据并行3.3 类别特征处理 4. 关键参数说明4.1 核心参数4.2 控制速度参数4.3 控制过拟合参数 5. 与XGBoost对…

网络安全-等级保护(等保) 2-7-3 GB/T 25058—2019 第7章 安全设计与实施

############################################################################### 对于安全厂家而言,最关心的内容在本章节,根据已确定的安全总体方案,完成技术措施和管理措施的详细设计和实施,包含具体的安全产品和管理要求。…

PHP-FPM 调优配置建议

1、动态模式 pm dynamic; 最大子进程数(根据服务器内存调整) pm.max_children 100 //每个PHP-FPM进程大约占用30-50MB内存(ThinkPHP框架本身有一定内存开销)安全值:8GB内存 / 50MB ≈ 160,保守设置为100 ; 启动时创建的进程数&…

DDoS防护实战——从基础配置到高防IP部署

一、基础防护:服务器与网络层加固 Linux内核优化: 调整TCP协议栈参数,缓解SYN Flood攻击: # 启用SYN Cookie并减少超时时间 echo 1 > /proc/sys/net/ipv4/tcp_syncookies echo 30 > /proc/sys/net/ipv4/tcp_fin_timeout…

使用 NGINX 的 `ngx_http_secure_link_module` 模块保护资源链接

一、模块简介 版本:自 NGINX 0.7.18 起引入 功能: 签名校验:对请求 URI 中的签名进行校验,保证链接未经篡改。时效控制:根据请求中携带的过期时间,判断链接是否仍在有效期。 启用方式:编译 NG…

前端三剑客之HTML

前端HTML 一、HTML简介 1.什么是html HTML的全称为超文本标记语言(HTML How To Make Love HyperText Markup Language ),是一种标记语言。它包括一系列标签,通过这些标签可以将网络上的文档格式统一,使分散的Internet资源连接为一个逻辑整…