【LUT技术专题】图像自适应3DLUT - 指南

news/2025/10/5 13:45:49/文章来源:https://www.cnblogs.com/ljbguanli/p/19126516

【LUT技术专题】图像自适应3DLUT - 指南

在这里插入图片描述

3DLUT开山之作: LearningImage-adaptive 3D Lookup Tables for High Performance Photo Enhancement in Real-time(2020 TPAMI )


本文将从头开始对3DLUT开山之作: Learning Image-adaptive 3D Lookup Tables for High Performance Photo Enhancement in Real-time,第一篇利用学习的方法来得出图像自适应3DLUT算法进行讲解,这篇主要的亮点在于作者利用CNN和3DLUT结合完成了图像自适应的3DLUT图像增强,在保持LUT轻量化的优势前提下,提升了泛化性和算法性能。参考资料如下:
[1]. 论文地址
[2]. 代码地址


专题介绍

Look-Up Table(查找表,LUT)是一种数据结构(也许可理解为字典),通过输入的key来查找到对应的value。其优势在于无需计算过程,不依赖于GPU、NPU等特殊硬件,本质就是一种内存换算力的思想。LUT在图像处理中是比较常见的运行,如Gamma映射,3D CLUT等。

近些年,LUT科技已被用于深度学习领域,由SR-LUT启发性地提出了模型训练+LUT推理的新范式。
本专题旨在跟进和解读LUT技术的发展趋势,为读者分享最全最新的LUT途径,欢迎一起探讨交流,对该专题感兴趣的读者可以订阅本专栏第一时间看到更新。

系列文章如下:
【1】SR-LUT
【2】Mu-LUT
【3】SP-LUT
【4】RC-LUT
【5】EC-LUT
【6】SPF-LUT
【7】Dn-LUT
【8】Tiny-LUT


一、研究背景

简单来说,当时已有的利用CNN建立的图像颜色增强算法,虽然在效果上比较显著,只是消耗大量计算和内存资源,尤其是在一些高分辨率的图像上。本文为了解决这个问题,首次结合3DLUT工具到AI ISP中,保持了LUT低资源消耗的优势,又提升了算法的性能。
回顾传统的3D LUT器具,通常是在ISP pipeline中或者图像编辑应用中作为一个手动调整或者是固化的算子来应用,一般不会随着图像进行自适应的增强,本文提出的办法则可以根据图像的不同输出不同的LUT。 总结就是综合了LUT和原有CNN的优势,然后达到了更好的效果,提升了实用性。

作者接着对比了一下相关工作,阐述本方案的优势之处,有以下三种,三种类型相关工作各有不足,本文的方式则是:
1)使用CNN来搭建的image2image是在AI ISP中常见的一个方式,但此种基于CNN的网络在高分辨率下,资源消耗巨大。
2)预测一组预定义的增强算子或映射曲线,这个地方大家许可想象预测一条曲线(1DLUT)用来调整对比度,通过将亮度完成单点1对1的映射提升对比度,通常这类方法会输入一个图像的低分辨率图来进行估计这个曲线,从而完成对高分辨率图像的增强。但这种方法使用的算子过于简单,不能供应足够的增强能力,并且很难从数据中直接学习。
3)采用强化学习来对输入图像进行迭代增强,显然这会牺牲效率,强化学习需要大量约束来帮助模型学习,没有监督学习便于采用。

通过本文则是能够综合上述的优点,最后总结一下本文的贡献,主要有3点:
1)第一次通过学习3D LUT的方式,使用成对和非成对的数据集进行训练,并完成自动的图像增强
2)提出的模型在600k的参数两下,在Titan RTX GPU上只花费2ms的时间就能够处理4K图像,应用价值高。
3)基准数据集验证了在成对和非成对数据集上,模型在定量和定性的实验中都优于当时最先进的图像增强方法。

二、图像自适应3DLUT方法

2.1 前置知识

1)3DLUT:学习一个3个输入index索引一个3维向量的LUT表,如下图立方体所示,每个立方体上的点都有它对应的值,对应到实际应用,就是颜色的增强。

在这里插入图片描述
3D LUT上的点,该插值方式在本专栏的就是2)trilinear interpolation:立方体插值,通过一个浮点数的位置找到其周围8个顶点的距离进行加权,加权的值是小立方体的体积,插值的点SR-LUT有讲到过。如下图所示,是一次插值的过程。
在这里插入图片描述
用公式表示这个插值过程就是:
c ( x , y , z ) O = ( 1 − d x ) ( 1 − d y ) ( 1 − d z ) c ( i , j , k ) O + d x ( 1 − d y ) ( 1 − d z ) c ( i + 1 , j , k ) O + ( 1 − d x ) d y ( 1 − d z ) c ( i , j + 1 , k ) O + ( 1 − d x ) ( 1 − d y ) d z c ( i , j , k + 1 ) O + d x d y ( 1 − d z ) c ( i + 1 , j + 1 , k ) O + ( 1 − d x ) d y d z c ( i , j + 1 , k + 1 ) O + d x ( 1 − d y ) d z c ( i + 1 , j , k + 1 ) O + d x d y d z c ( i + 1 , j + 1 , k + 1 ) O ,cO(x,y,z)=(1dx)(1dy)(1dz)cO(i,j,k)+dx(1dy)(1dz)cO(i+1,j,k)+(1dx)dy(1dz)cO(i,j+1,k)+(1dx)(1dy)dzcO(i,j,k+1)+dxdy(1dz)cO(i+1,j+1,k)+(1dx)dydzcO(i,j+1,k+1)+dx(1dy)dzcO(i+1,j,k+1)+dxdydzcO(i+1,j+1,k+1),c(x,y,z)O=(1dx)(1dy)(1dz)c(i,j,k)O+dx(1dy)(1dz)c(i+1,j,k)O+(1dx)dy(1dz)c(i,j+1,k)O+(1dx)(1dy)dzc(i,j,k+1)O+dxdy(1dz)c(i+1,j+1,k)O+(1dx)dydzc(i,j+1,k+1)O+dx(1dy)dzc(i+1,j,k+1)O+dxdydzc(i+1,j+1,k+1)O,
其中d x d_xdxd y d_ydyd z d_zdz分别是到最左下角点的距离,自然每个插值加权了一个立方体的体积。

2.2 整体流程

整体流程如下图所示。
在这里插入图片描述

  1. 起初输入HR图像进行下采样得到LR图像,LR图像送入CNN weight predictor中预测得到w 1 w_1w1w 2 w_2w2w 3 w_3w3用于加权Basis 3D LUTs的权重。就是,此
  2. 3D LUTs加权后得到一个Image-adaptive 3D LUT,显然这个3D LUT的生成过程是符合随着图像的变化而变化的这个特性的,这个LUT将作用于HR图像完成图像的增强,得到增强结果。
  3. 结果进行损失的计算,当然成对的图像使用论文设计的成对损失,否则使用非成对的损失进行模型优化。

作者接下来讲了为什么这么设计的原因,作者认为传统的3DLUT有两个局限性:

  1. 3D LUT手工设计,麻烦且昂贵。
  2. 预设一些LUT,然后让用户去选择,这不够灵活。就是1个3D LUT只能提供固定的变换,难以适应不同的场景,现有的一般都

针对性的,为了消除第一个挑战,采用数据驱动的方式,因为是资料集学习,所以也不存在所谓手工设计的情况。

针对第二个局限,模型只要求能够有对图像有针对性的调整即可,则引入了CNN来预测权重,那这里当然会存在一个分歧,要是作者设计成一个分类器,即强行选择某一个LUT(hard-voting strategy)。作者分析了这种方式存在明显的问题,第一,很难以将某些场景归为特定的一些类从而让他们共享一个LUT,其次由于每个3DLUT都是独立作用于输入图像,因此需要大量的3D LUT来覆盖所有场景,最后分类器的训练独立于各个3D LUT使得他们之间的协作不是最优的,并且一旦分类错误会引入artifact。

2.3 损失函数的设计

1)内容相关的损失:

2)正则化项:作者使用了两个正则化损失,来确保结果的正常:

三、实验结果

本篇文章的实验相当详细,首先讲一下消融实验
1)预设的3D LUT数目,文中展示的是3个,作者做了实验。
在这里插入图片描述
这里的Delta E是CIELAB色彩空间中定义的色差度量,显然定量的实验证明是LUT数目越多,效果越好,但作者为了权衡资源消耗和效果选择了3个,毕竟后续效果增长不多。
2)正则损失的权重大小:引入了λ s \lambda_sλsλ m \lambda_mλm分别代表平滑损失和单调损失的大小,最初实验了他们的一个单调增长对于效果的影响,λ s \lambda_sλs越大,PSNR会显著下降,这是行预料到的,因为平滑性限制了3D LUT的转换灵活性,而对于单调性来说,权重影响不大,因为他只是一个自然的约束,不会对其增强效果有太多抑制。

.

随后作者做了一个定性的实验来看这些损失对于实际效果的影响,如下图所示。
在这里插入图片描述
对于完全不加约束的(a)来说,中间的天空出现了明显的分层现象,(b)做了平滑损失有一定的改善,但还是存在带状的一个分层,©有单调约束后对于带状的分层有了改善,但是仍然存在部分局部不平滑的问题,相比较来说(d)就更加好,不存在前面的问题,结合起来效果才会更好一些,作者在这里还做了对LUT切面的分析,整体会更有说服力,感兴趣的作者可以补充看一下,作者的实验做的非常的完整和详细。
最终作者借助以上实验给出了结论选择λ s \lambda_sλsλ m \lambda_mλm分别为0.0001和10,在增强和模型稳定性之间取得一个平衡。
3)自适应LUT:这个主要就是看CNN给的weight是否有用,显然是有用的,作者做了定性的实验来说明这点。
在这里插入图片描述
针对自适应的LUT,固定LUT的效果有明显劣势。

消融实验讲完了,后续是作者的一些跟其他方法的效果对比实验。
1)成对内容:

2)非成对数据:

3)User study:用户主观的判断,同样是优势。
在这里插入图片描述
其中(a)是他们的测试界面,(b)和(c) 是成对和非成对类的结果对比,用户喜爱比是领先的。

4)耗时比对:非常明显的优势,差了数量级。
在这里插入图片描述

四、局限

通过作者提了几个局限,从这里也能够看出这篇文章的内容非常的详细和完整,做了大量的实验。
1)局部对比度不够:因为是全局的LUT途径,所以在一些场景下存在问题,比如说:
在这里插入图片描述
在不加local tone mapping之前,3DLUT对于阴影部分的处理是不够好的。
2)可能会对噪声进行增强:由于增强可能会放大噪声,所以是需要在有噪声的环境下配合降噪使用。
在这里插入图片描述
图中放大的部分存在噪声被增强的情况。

五、总结

图像自适应的3DLUT算是开了一个新篇章,能够有用的根据图像来自适应的生成3DLUT对图像进行增强,并且引入的正则项可以有效的抑制模型的异常,整体来说是极其实用的一个技术,相信在很多实际的场景下已经得到了应用。

代码部分将会单起一篇进行解读。(未完待续)


感谢阅读,欢迎留言或私信,一起探讨和交流,如果对你有帮助的话,也希望可以给博主点一个关注,谢谢。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/928308.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入解析:基于51单片机的音乐盒键盘演奏proteus仿真

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

网站搭建大型公司企业电话查询黄页

目录 set 1基本用法 2Set 实例的属性和方法 3遍历操作 3.1 keys() , values() , entries() 3.2 forEach() 3.3遍历的应用 weakset 含义 语法 总结 set 1基本用法 ES6 提供了新的数据结构 Set。它类似于数组,但是成员的值都是唯一…

完整教程:AugmentFree:解除 AugmentCode 限制的终极方案 如何快速清理vscode和AugmentCode缓存—windows端

完整教程:AugmentFree:解除 AugmentCode 限制的终极方案 如何快速清理vscode和AugmentCode缓存—windows端pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; displa…

文件的物理结构II

索引分配 允许文件离散地分配在各磁盘块中,系统会为每一个文件建一张索引表 表中记录了文件的哥哥逻辑块对应的物理快 索引表中存放的磁盘块叫索引块 文件数据存放的磁盘块叫数据块 类似于页表 索引分配方式可以支持随…

白城网站建设哪家好金华百度推广公司

http状态码 后端调试 f8:逐行执行 f7:进入语句内部 f9:执行到下一个断点 前端调试 f10:逐行调试 f11:进入语句内部 f8:执行到下一个断点 日志 按照级别开启日志 日志的测试类 比如把application里…

03-delphi10.3下PDFium5.8的PdfView1显示相关

03-delphi10.3下PDFium5.8的PdfView1显示相关procedure TForm2.Button3Click(Sender: TObject); //正常显示 beginPdfView1.Width:= 420;PdfView1.Height:=594; end;procedure TForm2.Button4Click(Sender: TOb…

【开源程序】 黑客帝国系列系统监控软件:基于PyQt5的全方位资源监控系统

【开源程序】 黑客帝国系列系统监控软件:基于PyQt5的全方位资源监控系统2025-10-05 13:26 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: a…

ABC426

ABC426C. Upgrade Required 开一个桶来维护每种版本的电脑数量,一开始每个桶中的电脑数都是 \(1\) 用变量 \(r\) 来维护“第一个可能非空的版本号”,并且 \(r\) 只会单调递增。每次操作把 \(r\) 指向的连续若干个桶(…

muse cc 做网站wordpress 中文社区

商家转账到零钱是什么? 通过商家转账到零钱这个功能,如果我们系统需要对用户支付费用,比如发放佣金、提成、退款之类的,可以直接转账到用户的微信零钱。 【商家转账到零钱】是【企业付款到零钱】的升级版,2022年5月1…

完整教程:OS9.【Linux】基本权限(下)

完整教程:OS9.【Linux】基本权限(下)pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Mona…

wordpress一个主站多个子站百度百科优化排名

腾讯云4核8G服务器支持多少人在线访问?支持25人同时访问。实际上程序效率不同支持人数在线人数不同,公网带宽也是影响4核8G服务器并发数的一大因素,假设公网带宽太小,流量直接卡在入口,4核8G配置的CPU内存也会造成计算…

怎么样在服务器上建设网站济南建设网济南市建培中心

摘要:近几年,Android系统占据着智能移动设备操作系统领域中极大的市场份额。随着Android市场中软件数量的不断攀升,移动用户对Android应用的质量要求也越来越高。如何保证Android软件的质量,成为移动应用领域中亟待解决的问题。重视移动应用的测试工作,是提高Androi…

楚雄建设局网站成都平面设计公司

从叶到花,或从花到叶,于科研是一个过程,而于生命自身则永远只在此刻。花和叶都是一种记忆方式,果子同时也是种子。生命是闪耀的此刻,不是过程,就像芳香不需要道路一样。 ——顾城《一个人应该活得是他自己并且干净》 二叉搜索树:右子树节点值都比node大,…

专业的外贸网站建设安徽合肥网站制作

1⃣️环境准备 准备 Java 环境:终端输入 java -version 命令来确认版本是否符合 Elasticsearch 要求下载并解压 Elasticsearch:前往(https://www.elastic.co/downloads/elasticsearch)选择适合你的 Mac 系统的 Elasticsearch 版本…

完整教程:JVM——云原生时代JVM的演进之路

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

价值原语博弈:AI元人文的伦理架构探索

价值原语博弈:AI元人文的伦理架构探索 在人工智能伦理研究的当前阶段,我们面临着将抽象道德原则转化为可实践框架的挑战。本文提出“价值原语博弈”作为实现AI元人文理念的一种工程化路径,通过构建动态的价值计算模…

文件的物理结构I

对非空闲磁盘块的管理(存放了文件数据的磁盘块) 对空闲磁盘块的管理 文件快。磁盘块 内存管理中,进程的逻辑地址分为一个个页面,同样在外存中,为了方便管理,文件的逻辑地址分为了一个个的块 于是文件的逻辑地址也…

实用指南:【C++高并发内存池篇】性能卷王养成记:C++ 定长内存池,让内存分配快到飞起!

实用指南:【C++高并发内存池篇】性能卷王养成记:C++ 定长内存池,让内存分配快到飞起!pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !importan…

商丘家具网站建设个人网页制作模板html

2023.12.2 做一个后台管理网页(左侧边栏实现手风琴和隐藏/出现效果) 网页源码见附件,比较简单,之前用很多种方法实现过该效果,这次的效果相对更好。 实现功能: (1)实现左侧边栏的手…