《Robust Synthetic-to-Real Transfer for Stereo Matching》

论文地址:https://arxiv.org/pdf/2403.07705
源码地址:https://github.com/jiaw-z/DKT-Stereo


概述

通过在合成数据上预训练的模型在未见领域上表现出强大的鲁棒性。然而,在现实世界场景中对这些模型进行微调时,其领域泛化能力可能会严重下降。本文探讨了在不损害模型对未见领域泛化能力的前提下,如何微调立体匹配网络。研究动机来源于比较真实标签(GT)与伪标签(PL)在微调过程中的差异:GT会退化,但PL能够保持领域泛化能力。通过实验发现,GT与PL之间的差异包含了有价值的信息,这些信息可以在微调过程中对网络进行正则化。文章还提出了一种框架,该框架包括一个冻结的教师网络、一个指数移动平均(EMA)教师网络和一个学生网络。核心思想是利用EMA教师网络来衡量学生网络学到的内容,并动态改进GT和PL以进行微调。作者将该框架与最先进的网络集成,并在多个真实世界数据集上评估了其有效性。本文的贡献如下:

  • 首次尝试解决微调立体匹配网络时领域泛化能力下降的问题。我们基于真实标注和伪标注之间的差异将像素分为一致和不一致区域,并展示了它们在微调期间的不同作用。我们进一步分析了它们的作用,确定了导致领域泛化能力下降的两个主要原因:在没有足够正则化的情况下学习新知识和过度拟合真实标注细节。
  • 提出了F&E模块来解决这两个原因,过滤掉不一致区域以避免正则化不足,并在一致区域集成视差以防止过度拟合真实标注细节。
  • 引入了通过结合指数移动平均教师来动态调整不同区域的方法,实现了在保留领域泛化能力和学习目标域知识之间的平衡。
  • 开发了DKT微调框架,可以轻松应用于现有网络,显著提高了它们对未见领域的鲁棒性,并同时实现了有竞争力的目标域性能。

方法

在这里插入图片描述

定义

文中将像素划分为三类区域:
一致区域 X c ( τ ) X_c(\tau) Xc(τ):伪标签 D ^ ( x i ) \hat{D}(x_i) D^(xi)与真实标签 D ( x i ) D^(x_i) D(xi)差异小于阈值 τ \tau τ的区域
X c ( τ ) = x ∣ ∣ D ^ ( x i ) − D ( x i ) ∣ < τ X_c(\tau) = {x \mid |\hat{D}(x_i) - D^(x_i)| < \tau} Xc(τ)=xD^(xi)D(xi)<τ
该区域代表GT与PL高度对齐。
不一致区域 X i n c ( τ ) X_{inc}(\tau) Xinc(τ):GT与PL差异大于等于 τ \tau τ的区域
X i n c ( τ ) = x ∣ ∣ D ^ ( x i ) − D ∗ ( x i ) ∣ ≥ τ X_{inc}(\tau) = {x \mid |\hat{D}(x_i) - D^*(x_i)| \geq \tau} Xinc(τ)=xD^(xi)D(xi)τ
网络在该区域可能遇到预训练未见的新挑战。
无效区域 X i n v a l i d X_{invalid} Xinvalid:因GT稀疏性导致无标注的区域

关键发现

GT微调的问题

  • 不一致区域:网络学习新知识但缺乏正则化,导致域泛化能力下降。
  • 一致区域:网络可能过拟合GT的细节。

PL的优势

  • 一致区域:使用 X c ( 3 ) X_c(3) Xc(3)的PL微调可保留域泛化能力。
  • 无效区域:PL在无标注区域的预测能提升泛化能力。

联合训练:直接联合GT和PL效果不佳,但通过Filter and Ensemble (F&E)模块动态优化标签后,可平衡目标域性能和模型原有泛化能力。

DKT Framework

冻结教师:

  生成初始伪标签,微调过程中参数冻结,保留预训练模型的原始知识。

EMA教师:

  通过学生网络权重动态更新
θ T ′ = m ⋅ θ T ′ + ( 1 − m ) ⋅ θ S ( m ∈ [ 0 , 1 ] ) \theta_{T'} = m \cdot \theta_{T'} + (1-m) \cdot \theta_S \quad (m \in [0,1]) θT=mθT+(1m)θS(m[0,1])
EMA教师模型可以量化Student已掌握的知识,作为区域划分依据来衡量一致/不一致区域。

学生模型:

  使用改进后的GT和PL进行训练,最终用于推理,通过动态调整学习区域防止过拟合。

F&E模块:

F&E-GT(处理真实标注)
  区域划分:基于阈值τ(默认τ=3)将GT划分为:
    1)不一致区域( X i n c X_{inc} Xinc):|GT - EMA预测| ≥ τ。
    2)一致区域( X c X_c Xc):|GT - EMA预测| < τ
  动态处理机制:
     1) X i n c X_{inc} Xinc区域:以概率 p = 1 − ∣ X i n c ∣ ∣ X v a l i d ∣ p=1-\frac{|X_{inc}|}{|X_{valid}|} p=1XvalidXinc随机保留,减少高难度区域对学习过程的干扰。
     2) X c X_c Xc区域:通过随机权重α对GT和EMA预测进行线性插值:
D ˉ c ∗ = α ⋅ D ∗ + ( 1 − α ) ⋅ D ^ T ′ ( α ∼ U ( 0 , 1 ) ) \bar{D}^*_c = \alpha \cdot D^* + (1-\alpha) \cdot \hat{D}^{T'} \quad (\alpha \sim U(0,1)) Dˉc=αD+(1α)D^T(αU(0,1))
此外,将其限制输出与GT的偏差在±1像素内,且添加细粒度扰动防止细节过拟合。

F&E-PL(处理伪标签)

  区域筛选:通过掩码 M ^ = ∣ D ^ T − D ^ T ′ ∣ < τ \hat{M} = \vert \hat{D}^{T} - \hat{D}^{T'} \vert < \tau M^=D^TD^T<τ 过滤不一致区域。

  精度提升机制:在一致区域使用随机权重β集成两个Teacher的预测,渐进式提升PL质量:
D T = β ⋅ D ^ T + ( 1 − β ) ⋅ D ^ T ′ ( β ∼ U ( 0 , 1 ) ) D_T = \beta \cdot \hat{D}T + (1-\beta) \cdot \hat{D}{T'} \quad (\beta \sim U(0,1)) DT=βD^T+(1β)D^T(βU(0,1))

训练策略
最终损失函数结合改进后的GT和PL监督:
L = L d i s p ( D ^ , D ˉ ∗ , M ∗ ) + λ L d i s p ( D ^ , D ˉ T , M ^ ) L = L_{disp}(\hat{D}, \bar{D}^* ,M^*) + \lambda L_{disp}(\hat{D}, \bar{D}^T, \hat{M}) L=Ldisp(D^,Dˉ,M)+λLdisp(D^,DˉT,M^)
EMA重置机制:每5k步将EMA Teacher权重重置为当前Student, 使区域划分随学习进度动态更新。


实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/73629.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蓝桥杯第10届 后缀表达式

题目描述 给定 N 个加号、M 个减号以及 NM1 个整数 A1,A2,⋅⋅⋅,ANM1​&#xff0c;小明想知道在所有由这N 个加号、M 个减号以及 NM1 个整数凑出的合法的 后缀表达式中&#xff0c;结果最大的是哪一个&#xff1f; 请你输出这个最大的结果。 例如使用 1 2 3 -&#xff0c…

C++前缀和

个人主页&#xff1a;[PingdiGuo_guo] 收录专栏&#xff1a;[C干货专栏] 大家好&#xff0c;今天我们来了解一下C的一个重要概念&#xff1a;前缀和 目录 1.什么是前缀和 2.前缀和的用法 1.前缀和的定义 2.预处理前缀和数组 3.查询区间和 4.数组中某个区间的和是否为特定…

uni app跨端开发遇到的问题

技术栈 uni app&#xff0c;vue3&#xff0c;uview puls&#xff0c;map… nvue 因为项目中有地图&#xff0c;要使用到map标签&#xff0c;所以考虑用原生nvue开发&#xff0c;它是有痛点的&#xff0c;首先浏览器不支持&#xff0c;我是要开发ios和Android&#xff0c;所以…

SQL注入操作

sql注入 一&#xff0c;SQL注入分类按照注入的网页功能类型分类按照注入点值的属性分类基于从服务器返回内容按照注入的程度和顺序 一&#xff0c;SQL注入分类 按照注入的网页功能类型分类 登录注入cms注入 cms逻辑&#xff1a;index.php首页展示内容&#xff0c;具有文章列表…

微信 MMTLS 协议详解(五):加密实现

常用的解密算法&#xff0c;对称非对称 加密&#xff0c;密钥协商&#xff0c; 带消息认证的加解密 #生成RSA 密钥对 void GenerateRsaKeypair(std::string& public_key,std::string& private_key) {RSA* rsa RSA_new();BIGNUM* bn BN_new();// 生成 RSA 密钥对BN_s…

ROS melodic 安装 python3 cv_bridge

有时候&#xff0c;我们需要处理这些兼容性问题。此处列举我的过程&#xff0c;以供参考 mkdir -p my_ws_py39/src cd my_ws_py39 catkin_make_isolated-DPYTHON_EXECUTABLE/usr/bin/python3 \-DPYTHON_INCLUDE_DIR/usr/include/python3.8 \-DPYTHON_LIBRARY/usr/lib/x86_64-l…

深入学习:SpringQuartz的配置方式!

全文目录&#xff1a; 开篇语前言摘要概述1. 基于 XML 的传统配置配置步骤1.1 Maven 依赖1.2 XML 配置文件1.3 实现 Job 类 2. 基于 Java Config 的现代配置方式配置步骤2.1 Maven 依赖2.2 配置类2.3 实现 Job 类 3. 动态任务调度动态添加任务动态删除任务 4. Quartz 持久化配置…

ClickHouse与TiDB实操对比:从入门到实战的深度剖析

ClickHouse与TiDB实操对比&#xff1a;从入门到实战的深度剖析 宝子们&#xff0c;在当今数据驱动的时代&#xff0c;选择合适的数据库对于处理海量数据和支撑业务发展至关重要。ClickHouse和TiDB作为两款备受关注的数据库&#xff0c;各自有着独特的优势和适用场景。今天&…

element-ui messageBox 组件源码分享

messageBox 弹框组件源码分享&#xff0c;主要从以下两个方面&#xff1a; 1、messageBox 组件页面结构。 2、messageBox 组件属性。 一、组件页面结构。 二、组件属性。 2.1 title 标题&#xff0c;类型为 string&#xff0c;无默认值。 2.2 message 消息正文内容&#xf…

睡眠健康领域的智能硬件设备未来的发展趋势

随着社会节奏的不断加快&#xff0c;人们的睡眠问题愈发多了起来&#xff0c;主要表现有以下几个方面&#xff1a; 睡眠质量下降 浅睡眠增多&#xff1a;现代生活中&#xff0c;人们面临着各种压力源&#xff0c;如工作压力、生活琐事、经济压力等&#xff0c;这些压力会导致大…

支付页面安全与E-Skimming防护----浅谈PCI DSS v4.0.1要求6.4.3与11.6.1的实施

关键词&#xff1a;支付页面安全、E-Skimming、PCI DSS v4.0.1、第三方脚本、风险管理、持卡人数据、数据安全、第三方服务提供商、TPSP、内容安全、网页监控、恶意脚本攻击 本文为atsec和作者技术共享类文章&#xff0c;旨在共同探讨信息安全的相关话题。转载请注明&#xff…

【gradio】从零搭建知识库问答系统-Gradio+Ollama+Qwen2.5实现全流程

从零搭建大模型问答系统-GradioOllamaQwen2.5实现全流程&#xff08;一&#xff09; 前言一、界面设计&#xff08;计划&#xff09;二、模块设计1.登录模块2.注册模块3. 主界面模块4. 历史记录模块 三、相应的接口&#xff08;前后端交互&#xff09;四、实现前端界面的设计co…

案例分享|树莓派媒体播放器,重构商场广告的“黄金三秒”

研究显示&#xff0c;与传统户外广告相比&#xff0c;数字户外广告在消费者心中的记忆率提高了17%&#xff0c;而动态户外广告更是能提升16%的销售业绩&#xff0c;整体广告效率提升了17%。这一显著优势&#xff0c;使得越来越多资源和技术流入数字广告行业。 户外裸眼3D广告 无…

23种设计模式-装饰器(Decorator)设计模式

装饰器设计模式 &#x1f6a9;什么是装饰器设计模式&#xff1f;&#x1f6a9;装饰器设计模式的特点&#x1f6a9;装饰器设计模式的结构&#x1f6a9;装饰器设计模式的优缺点&#x1f6a9;装饰器设计模式的Java实现&#x1f6a9;代码总结&#x1f6a9;总结 &#x1f6a9;什么是…

[Vue]事件修饰符

文章目录 一、语法介绍二、添加代码三、结果展示四、参考文献 如有错误&#xff0c;请指正&#xff01;&#xff01;&#xff01; 一、语法介绍 1、问题来源 我们在处理网页时&#xff0c;当点击按钮时会触发对应事件&#xff0c;但是有时并不想触发该时间&#xff0c…

Go 语言 sync 包使用教程

Go 语言 sync 包使用教程 Go 语言的 sync 包提供了基本的同步原语&#xff0c;用于在并发编程中协调 goroutine 之间的操作。 1. 互斥锁 (Mutex) 互斥锁用于保护共享资源&#xff0c;确保同一时间只有一个 goroutine 可以访问。 特点&#xff1a; 最基本的同步原语&#x…

ubuntu22.04安装搜狗输入法保姆教程~

一、添加中文语言支持 1.首先打开设置,找到Language and Region 2.点击Manage Installed Languages 3.点击 Install/Remove Languages... 4.选中Chinese (simplified),点击Apply

docker中间件部署

1.docker安装 # 1.卸载旧版本 yum remove docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-latest-logrotate \docker-logrotate \docker-engine# 2.需要的安装包 yum install -y yum-utils# 3.设置镜像的仓库 # 3.1.默认是国外的&#x…

python康复日记-request库的使用,爬虫自动化测试

一&#xff0c;request的简单应用 #1请求地址 URLhttps://example.com/login #2参数表单 form_data {username: admin,password: secret } #3返回的响应对象response response requests.post(URL,dataform_data,timeout5 ) #4处理返回结果&#xff0c;这里直接打印返回网页的…

强化学习和智能决策:Q-Learning和Deep Q-Learning算法

强化学习(Reinforcement Learning, RL)是机器学习的一个重要分支,它通过智能体(Agent)与环境交互来学习最优决策策略,旨在最大化智能体的长期累积奖励。Q-Learning和Deep Q-Learning是强化学习中的两种关键算法,它们在智能决策领域发挥着重要作用。 一、强化学习基础 …