python去除图像光照不均匀_CVPR 2020 | 从重建质量到感知质量:用于低光照增强的半监督学习方法...

CVPR 2020 | 从重建质量到感知质量:

用于低光照增强的半监督学习方法

961c8e647c2ec0c766b7893b65df0d18.png

Code: https://github.com/flyywh/CVPR-2020-Semi-Low-Light

1

背景

478ca7cedca63f3b98ac4b0b86cf0c90.gif

本篇为大家介绍我们组被2020年IEEE国际计算机视觉与模式识别会议(CVPR 2020)接收的工作《From Fidelity to Perceptual Quality: A Semi-Supervised Approach for Low-Light Image Enhancement》。该文章主要针对低光照增强任务。现有的高性能低光照增强工作大多数基于全监督或无监督学习方法——前者提供更详细具体的建模信息,但一方面数据往往难以收集导致缺乏多样性,另一方面客观的重建质量与主观的感知质量并不完全重合;后者可以收集更多样的数据提升泛化性能,但代价是噪声消除以及细节重建性能较差。本文通过深度学习来进行低光照图像的半监督学习,提出了一种递归频带表示来连接无监督和全监督框架。本文提取出一系列由粗到精的频带表示,并通过递归的端到端学习进行增强,进行噪声去除和细节修正。在感知质量引导的对抗学习下,深度频带表示进行重构,生成最终的增强结果。大量实验从多角度证明了该网络结构的有效性,展现出超过现有各类方法的优秀表现。

低光照增强任务介绍

在暗光场景下进行拍摄会导致成片的一系列降质,例如低亮度、低对比度以及密集的噪声。利用更尖端的摄影设备或是更专业的摄像技术可以在一定程度上降低暗光带来的降质。然而这些选择也很难解决较弱的信号淹没在相对高强度的系统噪声中这一问题。利用长曝光来减轻噪声是一个常见且有效的选择,然而在动态场景下长曝光会带来运动模糊。在拍摄设备普及,拍摄需求旺盛且拍摄场景多样的当下,如何减轻,甚至去除这种暗光场景带来的图像降质,成为了学术界及工业界亟待解决的问题。

2

算法

478ca7cedca63f3b98ac4b0b86cf0c90.gif

本文首先使用端到端的网络提取出一系列由粗到精的频带表示,并用重建目标进行全监督,保证频带表示的重建质量要求,并通过递归的框架进行增强,进一步进行噪声去除和细节修正。然后通过对抗学习的方法,组合不同粒度的频带表示,重构最终结果,使用对抗学习以及感知损失进行感知质量引导的无监督学习。

网络结构

具体的半监督深度递归频带网络(DRBN)结构如图所示。

8acb3998de90453ae936c5f873778e75.png

图1 深度递归频带网络结构

首先是深度频带学习阶段。将低光照图像输入带有残差连接的深度网络中,提取其中不同粒度的特征作为图像的频带表示。在重建时粒度最粗的表示作为基本层,对粒度相对较细的表示采取残差学习的方式,输出重建结果。在进行第一轮的特征提取后,与图像同分辨率的频带表示和图像同时作为下一轮递归网络的输入,不同粒度的表示都会作为下一轮递归的基础做残差学习。本文采用了4轮递归,最后一轮递归重建出的最细粒度的图像将作为整个深度频带学习阶段的最终结果,与重建目标进行目标函数计算并反传。此阶段的目标函数为三个粒度上的SSIM Loss。

然后是频带重构阶段。将深度频带学习阶段三个粒度上的最终输出插值到标准分辨率后做差,输入网络进行权重学习,将输出的权重与对应的通道相乘后求和,输出最终的重构结果。重构出的图像将计算目标函数。此阶段的目标函数包括判定是否为高质量图像的Discriminator Loss,利用VGG提取特征的Perceptual Loss以及衡量保真度的SSIM Loss,其中Discriminator由工作[1]提供的数据作为训练集。该目标函数作为感知引导,可以将仅关注重建质量的图像进一步进行感知质量的增强。

3

实验

478ca7cedca63f3b98ac4b0b86cf0c90.gif

本文利用LOL[2]数据集进行训练以及测试,在不同的设置下进行了实验以验证网络的性能。这些实验证明DRBN在低光照场景下的应用价值以及网络所采用的模块的有效性。

定量实验

0dc96641d9239cfe9c4ed853e5f2b191.png

图2 客观指标对比实验

定量对比试验与BIMEF, BPDHE, CRM, DHECE, MR. JED, RRM, SRIE, Dong, EFF, CLAHE, LIME, MF, DRD, DeepUPE, SICE和EG进行了对比,指标选择了PSNR,SSIM以及基于伽马矫正结果的SSIM(SSIM-GC)。可以看到在这些指标下,DRBN对LOL-Real数据集有更好的重建质量。

定性实验

866191b06a65cb7e5bc344fca084ab7d.png1bdc4e6af527d048ec7a235e17fedbcf.png

图3 主观结果对比实验

定性对比试验提供了各类低光照增强方法的最终结果。可以看到与其他方法相比,DRBN在噪声处理和细节恢复上有着更佳的性能,且输出的图像有更好的视觉质量。

消融实验

6e7010961f3a7bc78e52db4e311ffd9f.png

图4 感知引导有效性实验

消融实验主要针对本文采用的两阶段框架。图4中从左到右依次是:输入、第一阶段输出、第二阶段输出以及作为参考的正常光照图像。可以看到第二阶段的感知引导能有效地提升图像的主观质量,有更鲜明的色彩和较强的对比度。

4

总结

478ca7cedca63f3b98ac4b0b86cf0c90.gif

该文章设计了一种基于半监督学习的兼顾重建质量以及感知质量的低光照增强方法,利用两阶段的框架实现了图像重建质量和感知质量的增强。作者通过实验证明了整体网络框架的优越性以及感知引导作为网络模块的有效性,为未来相关领域的工作提供了新的思路。

791ea20b79bd23499c65347fbfb44cc4.png

扫码访问代码主页

或点击左下方“阅读原文”进行跳转。

参考文献

[1] N. Murray, L. Marchesotti, and F. Perronnin. Ava: A largescale database for aesthetic visual analysis. In Proc. IEEEInt’l Conf. Computer Vision and Pattern Recognition, pages2408–2415, June 2012. 5

[2] Chen Wei, Wenjing Wang, Wenhan Yang, and Jiaying Liu.Deep retinex decomposition for low-light enhancement. InBritish Machine Vision Conference, Sept 2018. 1, 3, 5, 6

28c32c2a2cc38fae357c94e5215eb824.png

想知道更多有趣项目

欢迎扫码访问小组主页

www.wict.pku.edu.cn/struct/

948fa54ef499ed80632be196d5a674e4.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/340984.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jpa 手动预编译_编译时检查JPA查询

jpa 手动预编译JPA提供了几种查询数据的方法。 可以根据各种标准(例如,使用的语言(SQL与JPQL)或查询是静态的(编译时间)还是动态的(执行时间))对此类替代方案进行分类。 …

多层陶瓷电容器用处_【科普贴】多层陶瓷电容器的制造工序,你知道吗?

本文将向大家介绍多层陶瓷电容器的结构及制造工序。多层陶瓷电容器的基本结构电容器用于储存电荷,其最基本结构如图1所示,在2块电极板中间夹着介电体。图1. 电容器的基本结构电容器的性能指标也取决于能够储存电荷的多少。多层陶瓷电容器为了能够储存更多…

使用ORM提取数据很容易! 是吗?

介绍 几乎任何系统都以某种方式与外部数据存储一起运行。 在大多数情况下,它是一个关系数据库,并且数据获取通常委托给某些ORM实现。 ORM涵盖了很多例程,并带来了一些新的抽象作为回报。 Martin Fowler写了一篇有关ORM的有趣文章 &#xff0…

分段式多级离心泵_离心泵与多级离心泵工作原理

离心泵工作原理:离心泵工作时,液体注满泵壳,叶轮高速旋转,液体在离心力作用下产生高速度,高速液体经过逐渐扩大的泵壳通道,动压头转变为静压头。性能特点:高效节能:泵有高效的水力形…

java8 javafx_JavaFX技巧8:美丽深层

java8 javafx如果您正在开发JavaFX的UI框架,请养成一种习惯,始终将自定义控件拆分为控件类和外观类。 来自Swing自己,这对我来说并不明显。 Swing还使用MVC概念,并将实际的组件呈现委托给UI委托,但是扩展Swing的人们大…

牛客网数据开发题库_数据库刷题—牛客网(21-30)

21.查找所有员工自入职以来的薪水涨幅情况,给出员工编号emp_no以及其对应的薪水涨幅growth,并按照growth进行升序CREATE TABLE employees ( emp_no int(11) NOT NULL, birth_date date NOT NULL, first_name varchar(14) NOT NULL, last_name varchar(16…

弹性堆栈介绍

当您运行对公司至关重要的软件时,您将无法获得仅用于分析一段时间前发生的事情的日志,让客户端告诉您您的应用程序已损坏,而您甚至不知道发生了什么是真实的问题。 解决该问题的方法之一是使用监视和日志记录。 大多数应用程序都将具有日志记…

access统计没有选课的人数_当代大学生发愁求职就业,更发愁“选课”,自主选课变成了负担...

当代大学生除了求职就业,最发愁的就是“选课”。不得不说,随着科技的发展,各行各业都发生了翻天覆地的变化。而在大学里的选课,也因此有了巨大的改变。过去,大学生上课,其实课程都是被安排好的,…

产线数字化软件源码_品质笔记⑥丨卢宇聪:把握数字化趋势,坚定创新发展道路...

6天5夜,跨越3座城市,深度走访7家企业,对话多位企业家……这是一趟开阔视野之旅。我接触了很多之前极少有机会接触的企业,比如做光缆的法尔胜泓晟集团、做节能装备的双良集团、做密封件的天生密封件有限公司等。我以前经常接触的是…

es 安装kopf_Elasticsearch-kopf导览

es 安装kopf当我需要一个插件来显示Elasticsearch的集群状态时,或者需要深入了解通常为经典插件elasticsearch-head所达到的索引时。 由于有很多建议,而且似乎是非官方的继任者,所以我最近更详细地研究了elasticsearch-kopf 。 我喜欢它。 我…

会导致小程序onhide码 手机息屏_小程序onshow事件

问题描述onShow 事件在小程序里面非常重要,场景之多,导致处理起来很复杂。很多业务场景依赖与onShow与onHide事件。比如分享给他人,在群里PK等等。息屏,新页面返回、Home键操作,也会触发onShow事件。以下是官网的说明&…

Spring@主要注释

介绍: 当存在多个相同类型的bean时,使用Spring Primary批注为标记的bean提供更高的优先级。 默认情况下,Spring按类型自动连线。 因此,当Spring尝试自动装配并且有多个相同类型的bean时,我们将获得NoUniqueBeanDefini…

python帮助文档快捷键_Pycharm快捷键手册

AltEnter 自动添加包Ctrlt SVN更新Ctrlk SVN提交Ctrl / 注释(取消注释)选择的行CtrlShiftF 高级查找CtrlEnter 补全Shift Enter 开始新行TAB ShiftTAB 缩进/取消缩进所选择的行Ctrl Alt I 自动缩进行Ctrl Y 删除当前插入符所在的行Ctrl D 复制当前行、或者选择的块Ctrl …

arm 交叉编译找不到so_搭建交叉编译环境并验证

1. 搭建编译环境并验证1.1 实验目的 掌握嵌入式开发环境、交叉编译器的搭建、安装和配置方法 熟悉Linux应用程序的编译、调试方法,能够验证X86平台和ARM平台的差异1.2 实验内容 交叉编译器环境搭建 编写一个典型的Linux应用程序 使用GDB调试Linux程序(PC平台) 用Mak…

雷达的工作原理示意图_电磁阀的构成和工作原理示意图

电磁阀符号的含义:电磁阀符号由方框、箭头、“T”和字符构成。电磁阀图形符号的含义一般如下:1、用方框表示阀的工作位置,每个方块表示电磁阀的一种工作位置,即“位”。有几个方框就表示有几“位”,如二位三通表示有两…

JDK 14 Rampdown:内部版本27

马克 雷因霍尔德( Mark Reinhold)最近的帖子“ JDK 14现在处于Rampdown第一阶段 ”宣布“我们现在处于Rampdown第一阶段”,并且“整体功能已冻结”。 JDK 14 Early Access Build #27(2019/12/12)是一个繁重…

从金蝶k3到金税盘_经典全套金蝶K3操作流程大全

—结帐—期末结帐注意点:不能结帐的原因:(1)有未过帐的凭证(2)无权限(3)其他子系统未结帐(4)与其他用户冲突八、套打1、套打格式凭证:*上海TR101记帐凭证上海TR102收款凭证 纸张大小:自定义大小上海TR103付款凭证 宽度&#xff1a…

sqlserver拼接字符串换行_1.3【Python】第三章 字符串

人工智能入门与实战第一季:python基础语法字符串是比较常见的数据类型,在第一章中我们最早接触的数据类型就是字符串:"hello world",字符串可以用单引号’‘或双引号""来表示代码示例:name "…

jsf按钮响应事件_如何从JSF获取JSON响应?

jsf按钮响应事件许多JavaScript小部件都希望使用JSON格式的数据和选项。 如今,选择一个很酷的小部件并将其包装在一个复合组件中确实很容易。 但是第一个问题是如何发送AJAX请求并以正确的JSON格式接收响应。 JSF用户经常会提出这个问题 。 您需要的只是一个XHTML f…

mot数据集_谈谈ReID与MOT的关系

1.ReID与MOT的联系在MOT任务中,一般常用的特征模型有运动模型和表观模型,其中表观模型以行人重识别(ReID)类算法为主流。Re-ID任务主要解决的是跨摄像头场景下行人的识别与检索,其中存在给定了身份的图片序列query,需要为不同摄像…