RoMa v2 - MKT

news/2026/1/18 21:09:44/文章来源:https://www.cnblogs.com/gooutlook/p/19499120

 

特别地,航空数据集AerialMD [45]和BlendedMVS [49]的包含,使我们提出的模型对大旋转和空对地视点变化显著更加鲁棒。小基线数据集的包含,如FlyingThings3D [26],使RoMa v2在预测精细细节方面显著更好。我们在图7中定性地比较了RoMa v2与RoMa在FlyingThings3D数据集上的精细预测。我们还发现,我们的数据混合使我们能够比RoMa显著更好地预测无纹理表面,特别是在自动驾驶(AD)场景中,尽管只在非常小规模的数据集VKITTI2 [6, 13]上训练。我们在图8中展示了从NuScenes数据集[7]中随机选择的一对的结果。


————————————————
版权声明:本文为CSDN博主「昵称是6硬币」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_46248968/article/details/155163674

特别地,航空数据集AerialMD [45]和BlendedMVS [49]的包含,使我们提出的模型对大旋转和空对地视点变化显著更加鲁棒。小基线数据集的包含,如FlyingThings3D [26],使RoMa v2在预测精细细节方面显著更好。我们在图7中定性地比较了RoMa v2与RoMa在FlyingThings3D数据集上的精细预测。我们还发现,我们的数据混合使我们能够比RoMa显著更好地预测无纹理表面,特别是在自动驾驶(AD)场景中,尽管只在非常小规模的数据集VKITTI2 [6, 13]上训练。我们在图8中展示了从NuScenes数据集[7]中随机选择的一对的结果。


————————————————
版权声明:本文为CSDN博主「昵称是6硬币」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_46248968/article/details/155163674

 

 

 

RoMa v2: Harder Better Faster Denser Feature Matching
RoMa v2:更强更好更快更密集的特征匹配

论文地址:https://arxiv.org/abs/2511.15706

官仓地址:https://github.com/Parskatt/romav2

1林雪平大学,2查尔姆斯理工大学,3阿姆斯特丹大学,4隆德大学数学科学中心

【论文总结】

RoMa v2,密集特征匹配方法,通过系统性改进实现了更强、更快、更精确的匹配性能。总结如下:

(1)新颖的匹配架构与损失函数:将DINOv2升级到冻结的DINOv3基础模型提取特征,用单头注意力机制替代高斯过程(GP)解决梯度传播问题,引入负对数似然损失L N L L \mathcal{L}_{\mathrm{NLL}}L
NLL

作为辅助监督,结合鲁棒回归损失L w a r p \mathcal{L}_{\mathrm{warp}}L
warp

和重叠损失L o v e r l a p \mathcal{L}_{\mathrm{overlap}}L
overlap

,通过多视图Transformer实现帧级和全局注意力交替,学习多视图上下文;

(2)高效的两阶段匹配-细化流水线:解耦训练粗匹配器(步长4)和三级细化器(步长4/2/1),采用广义Charbonnier损失进行鲁棒回归,通过自定义CUDA内核优化局部相关计算显著降低内存占用,使用指数移动平均(EMA)消除亚像素偏差;

(3)像素级误差协方差预测:通过2 × 2 2\times22×2精度矩阵Σ − 1 \Sigma^{-1}Σ
−1
建模各向异性不确定性,采用Cholesky分解保证正定性,分层累积预测从粗到细的精度增量,可用于下游几何估计的残差重加权;

(4)多样化训练数据策略:混合宽基线数据集(MegaDepth、AerialMD、BlendedMVS)和小基线数据集(FlyingThings3D、VKITTI2)平衡极端视点鲁棒性与亚像素精度;

(5)分辨率自适应设计:在归一化网格上使用RoPE位置编码,固定低频位置嵌入(ω = 1 \omega=1ω=1),多分辨率混合训练确保跨分辨率泛化。实验表明RoMa v2在MegaDepth-1500、ScanNet-1500等多个基准上达到最先进性能,相比RoMa速度提升1.7倍,在AerialMegaDepth上EPE降低84%,同时保持对极端外观变化的强鲁棒性。
————————————————

 

【翻译】密集特征匹配旨在估计3D场景的两幅图像之间的所有对应关系,由于其高精度和鲁棒性,最近已被确立为黄金标准。然而,现有的密集匹配器在许多困难的真实世界场景中仍然失败或表现不佳,而高精度模型往往速度较慢,限制了其适用性。在本文中,我们通过一系列系统性改进从多个方面攻克这些弱点,这些改进共同产生了一个显著更好的模型。特别地,我们构建了一种新颖的匹配架构和损失函数,结合精心策划的多样化训练分布,使我们的模型能够解决许多复杂的匹配任务。我们进一步通过解耦的两阶段匹配-然后-细化流水线使训练更快,同时通过自定义CUDA内核显著减少细化的内存使用。最后,我们利用最新的DINOv3基础模型以及多个其他见解,使模型更加鲁棒和无偏。在我们广泛的实验中,我们表明所得到的新颖匹配器创造了新的最先进水平,比其前辈显著更准确。代码可在https://github.com/Parskatt/romav2获得。

【解析】密集特征匹配是在两幅图像的每个像素之间建立对应关系。作者提出的RoMa v2通过多个技术创新来提升效果。首先,新的匹配架构和损失函数设计,能更好地处理复杂的匹配场景,不仅考虑了像素级别的相似性,还融入了更广泛的上下文信息。其次,两阶段的匹配-细化流水线将粗匹配和精细匹配分离,既提高了训练效率,又保证了最终的匹配精度。使用自定义CUDA内核,进一步优化内存使用,使模型在实际应用中更加实用。DINOv3基础模型的引入为特征提取提供了更强的表示能力,提升了模型在各种视觉条件下的鲁棒性。最终使RoMa v2在多个基准测试中都达到了最先进的性能水平。

 

image

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1179408.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

小程序计算机毕设之基于springboot+微信小程序的服装购物平台的设计与实现小程序(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

吐血推荐10个一键生成论文工具,专科生毕业论文必备!

吐血推荐10个一键生成论文工具,专科生毕业论文必备! 专科生的论文救星,AI 工具如何改变你的写作方式? 在如今的学术环境中,论文写作早已不再是单纯的文字堆砌,而是对逻辑、结构和内容深度的综合考验。尤其是…

AArch64和X86下的函数调用 - Polaris

AArch64和X86下的函数调用 最近在研究llvm-bolt的indirect-call-promotion优化,借着这个机会一并总结下函数调用的概念以及底层的一些相关实现,鉴于知识局限性,部分细节描述可能不到位,欢迎纠正。 函数调用在 CPU层…

MCU单总线通信

文章目录 一、核心原理详解 1. 整体硬件原理 (1)硬件架构核心 (2)STM32 GPIO 配置核心(开漏输出) 2. 忙状态判定原理 (1)核心定义 (2)空闲状态双重侦听规则 (3)STM32 忙状态实现细节 3. 发送实现原理 (1)发送前准备 (2)逐位发送核心逻辑 (3)发送关键注意事项…

三维动态避障路径规划:基于部落竞争与成员合作算法(CTCM)融合动态窗口法DWA的无人机三维动态避障方法研究附MATLAB代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f34…

诺特定理:世界是二阶导的吗?

让我们回到诺特定理,真正的奥妙就在于此。我们现在有了工具:拉格朗日函数、欧拉-拉格朗日定理,让我们看看它们能构建出什么。 假设你的拉格朗日函数 \(L(q, \dot{q}, t)\) 具有连续对称性。这意味着存在某种变换 \(…

GESP认证C++编程真题解析 | 202306 四级

​欢迎大家订阅我的专栏:算法题解:C++与Python实现! 本专栏旨在帮助大家从基础到进阶 ,逐步提升编程能力,助力信息学竞赛备战! 专栏特色 1.经典算法练习:根据信息学竞赛大纲,精心挑选经典算法题目,提供清晰的…

洛谷 P11606 [PA 2016] 构树 / Reorganizacja - Rye

洛谷 P11606 [PA 2016] 构树 / Reorganizacja构造好题题目传送门 题目大意 有 \(n\) 个节点和 \(m\) 条限制,每条限制形如 \(x,y,T\) 或 \(x,y,N\) 分别表示 \(y\) 一定是 \(x\) 的祖先和 \(y\) 一定不是 \(x\) 的祖先…

CPU占用高排查

top命令,查看占用高的进程id top -p <进程id> -H -H参数显示进程内的线程列表,查看是哪个线程id jstack -p <进程id> | grep <线程id> -C 30 线程id在jdk8可能是16进制需要改下 查看对应线程的堆栈…

GESP认证C++编程真题解析 | 202303 二级

​欢迎大家订阅我的专栏:算法题解:C++与Python实现! 本专栏旨在帮助大家从基础到进阶 ,逐步提升编程能力,助力信息学竞赛备战! 专栏特色 1.经典算法练习:根据信息学竞赛大纲,精心挑选经典算法题目,提供清晰的…

智能风控平台 scalability 设计:AI应用架构师的经验分享

智能风控平台Scalability设计实战&#xff1a;AI应用架构师的5个核心策略 一、引言&#xff1a;为什么智能风控平台必须重视Scalability&#xff1f; 1. 痛点引入&#xff1a;你是否遇到过这些“崩溃瞬间”&#xff1f; 作为AI应用架构师&#xff0c;我曾亲历某电商平台大促期间…

[豪の算法奇妙冒险] 代码随想录算法训练营第三十一天 | 56-合并区间、738-单调递增的数字

LeetCode56 合并区间、LeetCode738 单调递增的数字代码随想录算法训练营第三十一天 | 56-合并区间、738-单调递增的数字LeetCode56 合并区间题目链接:https://leetcode.cn/problems/merge-intervals/description/ 文章…

MATLAB表格数据处理的项目落地经验(避坑+效率提升)

在科研数据分析、工程测试数据处理、工业报表生成等实际项目中,MATLAB的`readtable()`/`writetable()`及`table`对象操作是高频核心技能。我结合近5年的项目经验(如车载传感器数据解析、光伏实验数据处理、工业Excel…

最新论文 | EarthVL: 武大钟燕飞团队提出渐进式理解/生成框架, 从识别到深度理解遥感地物, 提供专业决策建议 - MKT

最新论文 | EarthVL: 武大钟燕飞团队提出渐进式理解/生成框架, 从识别到深度理解遥感地物, 提供专业决策建议https://mp.weixin.qq.com/s/6gVsTTZ7OT_VT5VcGsiDLA

《卷一》人形机器人导论:从机械设计到系统集成

第1篇 人形机器人的发展与基础认知第1章 人形机器人的发展历史、趋势与应用场景1.1 人形机器人的发展历程1.1.1 早期仿人研究到现代机器人1.1.2 ASIMO等标志性里程碑1.1.3 特斯拉、Figure、Unitree的商业化推动1.2 未来趋势与行业需求1.2.1 具身智能推动的产业变革1.2.2…

Flutter × OpenHarmony 跨端开发之汇率转换与汇率卡片展示

文章目录Flutter OpenHarmony 跨端开发之汇率转换与汇率卡片展示前言背景Flutter Harmony OpenHarmony 跨端开发介绍开发核心代码代码解析&#xff1a;心得总结Flutter OpenHarmony 跨端开发之汇率转换与汇率卡片展示 前言 随着全球化经济的发展&#xff0c;汇率的实时查询…

(1-1)人形机器人的发展历史、趋势与应用场景:人形机器人的发展历程

本章首先系统介绍了人形机器人的发展脉络&#xff0c;从早期仿人研究到ASIMO等里程碑事件&#xff0c;再到特斯拉、Figure、宇树等企业推动的商业化进程&#xff0c;勾勒出人形机器人产业的演进全景。然后进一步分析了具身智能、大模型融合背景下的人形机器人发展趋势及其在劳动…

优雅汇率:Flutter × OpenHarmony 跨端汇率转换计算器实现

文章目录优雅汇率&#xff1a;Flutter OpenHarmony 跨端汇率转换计算器实现前言背景Flutter Harmony OpenHarmony 跨端开发介绍开发核心代码构建转换计算器 Widget核心逻辑解析心得总结优雅汇率&#xff1a;Flutter OpenHarmony 跨端汇率转换计算器实现 前言 随着全球经济…

(1-2)人形机器人的发展历史、趋势与应用场景:未来趋势与行业需求

1.2 未来趋势与行业需求随着具身智能、大模型与机器人核心硬件的快速发展&#xff0c;人形机器人正从技术验证阶段迈向面向真实场景的规模化应用阶段。未来的发展趋势不仅体现在智能水平的持续提升&#xff0c;更体现在对劳动力结构、生产方式与服务形态的深刻重塑。在制造业、…

Flutter × OpenHarmony 汇率转换应用中的智能货币选择器实现

文章目录Flutter OpenHarmony 汇率转换应用中的智能货币选择器实现前言背景Flutter OpenHarmony 跨端开发介绍开发核心代码代码解析心得总结Flutter OpenHarmony 汇率转换应用中的智能货币选择器实现 前言 在现代移动应用中&#xff0c;货币转换功能是出境旅游、跨境电商及…