语义slam Fusion++ - MKT

news/2025/10/29 5:33:25/文章来源:https://www.cnblogs.com/gooutlook/p/19173064

image

 

image

 

2. Fusion++的核心思想:范式转变

Fusion++彻底改变了游戏规则。它不再将世界看作一个统一的几何空间,而是将其看作由​​背景​​和​​多个独立的物体实例​​组成的集合。

思想一:实例级表示 —— 为每个物体建立独立的“数字孪生”

这是最核心的创新。Fusion++为场景中检测到的​​每一个物体实例​​(例如,一把特定的椅子、一个特定的显示器)都创建并维护一个​​独立的、局部的TSDF体积​​。

  • ​​传统SLAM子图​​:基于​​传感器移动​​创建。当相机移动一定距离后,创建一个新的子图来覆盖新的空间区域。
  • ​​Fusion++ 子图​​:基于​​语义实例​​创建。每当检测到一个新的物体(比如通过Mask R-CNN),就为它创建一个专属的子图。

image

 

思想二:解耦的姿态估计 —— 物体姿态 + 相机姿态

在传统SLAM中,只估计一个姿态:​​相机相对于全局地图的姿态(Camera Pose)​​。Fusion++引入了第二个关键姿态:​​物体相对于全局地图的姿态(Object Pose)​​。

  • ​​Object Pose (T_W_O)​​:描述每个物体实例在全局空间中的位置和方向。
  • ​​Camera Pose (T_W_C)​​:描述相机在全局空间中的位置和方向。

这种​​解耦​​的表示具有巨大优势:

  • ​​自然支持动态物体​​:当一个物体被移动时,只需要更新它的 ​​Object Pose (T_W_O)​​ 即可。物体的模型本身(TSDF体积)保持不变。背景模型和其他静态物体也完全不受影响。这从根本上解决了动态物体的“鬼影”问题。

(图示:物体姿态和相机姿态被分别估计和优化)

 

思想三:基于语义的、分层的的数据关联

在匹配时,Fusion++​​绝不​​进行暴力匹配。它采用了一种高效的分层策略:

  1. ​​语义筛选​​:当前帧检测到一个“椅子”时,系统只会去已有的实例库中寻找同为“椅子”的实例,瞬间排除了所有不相关的物体。
  2. ​​几何筛选​​:利用视锥体剔除等技术,进一步排除那些不在当前相机视野内的“椅子”实例。
  3. ​​外观/几何精细匹配​​:对剩下的极少数候选实例,进行轮廓重叠度(IoU)、外观相似度等计算,找到最匹配的实例。

这个过程高效且鲁棒,是系统能实时运行的关键。

 

 

3. Fusion++ 的工作流程

  1. ​​输入​​:实时的RGB-D图像流。
  2. ​​实例分割​​:对每一帧RGB图像使用2D实例分割网络(如Mask R-CNN),获得物体的边界框、掩码和语义标签。
  3. ​​数据关联​​:将检测到的实例与已有的“实例级TSDF子图库”进行匹配(使用上述分层策略)。
    • ​​如果匹配成功​​:将当前帧的深度数据融合到匹配到的实例子图中,并优化该实例的物体姿态。
    • ​​如果匹配失败​​(一个新物体):为该实例创建一个新的TSDF子图,并初始化其物体姿态。
  4. ​​相机跟踪​​:同时估计相机相对于全局场景的姿态。
  5. ​​全局优化(后端)​​:当检测到闭环(例如,再次看到同一个物体)时,在姿态图中联合优化所有物体姿态和相机姿态,以消除累计漂移。

 

. 核心思想的优势总结

  • ​​生成真正的“物体级”地图​​:输出是结构化的,包含语义信息,可用于高级任务(如“机器人,请拿起那个杯子”)。
  • ​​革命性的动态物体处理​​:动态物体不再是问题,而是被自然地支持。
  • ​​提升SLAM的精度和鲁棒性​​:物体可以作为强大的闭环约束,优化相机轨迹。
  • ​​高效的内存和计算管理​​:每个物体的TSDF体积是局部的、可控的。非活跃的物体可以被交换出内存。
  • ​​便于场景编辑和交互​​:可以轻松地添加、删除、移动场景中的物体。

 

生动的类比

想象一下重建一个乐高城堡的模型:

  • ​​传统SLAM​​:你用一大桶石膏把整个乐高城堡糊住,得到一个完整的、坚硬的石膏模型。你无法再移动里面的任何一个乐高小人。
  • ​​Fusion++​​:你为城堡里的​​每一个乐高部件​​(每个人、每扇门、每辆车)都建立一个独立的、精确的3D模型文件。整个城堡场景就是这些模型文件的集合,每个模型都有自己独立的位置信息。你可以随意移动一辆车,而完全不影响城堡的墙壁。

​​总而言之,Fusion++ 的核心思想是SLAM领域的一次范式革命。它将SLAM的目标从重建“几何”提升到了理解“物体”,为机器人感知、增强现实和数字孪生等领域提供了远见卓识,指明了发展方向。​

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/949253.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

点云配准 Deep closest point: Learning representations for point cloud registration, - MKT

点云配准 Deep closest point: Learning representations for point cloud registration,

tryhackme-网络安全基础-命令行- Linux Shells-23

tryhackme-Cyber Security 101-Command Line-Linux Shells 房间地址:https://tryhackme.com/room/linuxshells 这是网络安全入门的基础模块的计算机科学基础知识:Linux Shells,序号 01 表示第一篇文章,当你不知道从…

开发Minecraft Forge模组遇到的问题记录

开发工具:IDEA 2022.2.5 JDK:21.0.7 Forge:60.0.11 这里一定要清楚这些版本号,很多问题都是因为版本不兼容引起的,所以先声明使用工具的版本号,接下来踩坑开始(遇到的坑大概率会按照逻辑的先后顺去说明,而不是…

【ESP32 在线语音】 待写 TTS

链接:https://blog.csdn.net/vor234/article/details/138387195?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522dac311b95071f02fedec5ea5a048fdf6%2522%252C%2522scm%2522%253A%252220140713.130102334…

Fusion++ 语义实例分割​​与​​稠密SLAM重建​​在TSDF子图层面进行了深度融合 - MKT

Fusion++ 语义实例分割​​与​​稠密SLAM重建​​在TSDF子图层面进行了深度融合 3. Fusion++ 的完整工作流程 ​​步骤一:基于RGB-D帧的实例分割(每帧)​​输入每一帧RGB-D图像。 使用2D实例分割网络(如Mask R-C…

tryhackme-网络安全基础-命令行- Windows PowerShell-22

tryhackme-Cyber Security 101-Command Line-Windows PowerShell 房间地址:https://tryhackme.com/room/windowspowershell 这是网络安全入门的基础模块的计算机科学基础知识:Windows PowerShell,序号 01 表示第一篇…

【ESP32 在线语音】音频接收的缓存机制和网络发送机制

首先是初始化 I2S 设备中,可能用到了缓存 //初始化 I2S 设备 INMP441Serial.println("Setup I2S ...");i2s_install();i2s_setpin();esp_err_t err = i2s_start(I2S_PORT_0);其中的 i2s_install() 配置了 …

XCPC英语学习day2

2024ICPC昆明 A. Antivicus 在介绍网络流的时候,几乎还没开始讲,pet chicken指出如何解决这个问题。老师惊呼:我们的禽流感太棒了。 ——Roasted-chicken Htrule进入了流感季。 Hyrule由n个城市组成,由m条有向道路…

2025年PFA隔膜阀厂家权威推荐榜:耐腐蚀高纯流体阀门专业制造商,精选PFA/四氟阀门优质品牌解析

2025年PFA隔膜阀厂家权威推荐榜:耐腐蚀高纯流体阀门专业制造商,精选PFA/四氟阀门优质品牌解析 行业背景与发展现状 在半导体制造、生物医药、精细化工等高技术领域,高纯流体输送系统的可靠性与洁净度直接关系到产品…

2025年PFA隔膜阀厂家权威推荐榜:耐腐蚀高纯流体专用阀门,PTFE/FEP/PFA材质隔膜阀源头企业综合评测

2025年PFA隔膜阀厂家权威推荐榜:耐腐蚀高纯流体专用阀门,PTFE/FEP/PFA材质隔膜阀源头企业综合评测 在半导体制造、生物医药、精细化工等高技术领域,高纯流体输送系统的稳定性和可靠性直接关系到生产质量和工艺安全。…

【ESP32 在线语音】音频接收的缓存机制

首先是初始化 I2S 设备中,可能用到了缓存 //初始化 I2S 设备 INMP441Serial.println("Setup I2S ...");i2s_install();i2s_setpin();esp_err_t err = i2s_start(I2S_PORT_0);其中的 i2s_install() 配置了 …

我在iOS/Swift工程中成功编译了HarfBuzz!

我在iOS/Swift工程中成功编译了HarfBuzz!https://github.com/HusterYP/HarfBuzziOS/tree/main 跨端渲染又进一步!!

Python access mysql and insert data batch by batch

pip install mysql-connector or pip install mysql-connector-python -i https://pypi.tuna.tsinghua.edu.cn/simple/create table t2(id bigint primary key auto_increment,firstname varchar(100) not null defaul…

CodeForces-2153D Not Alone

tag: 结论题,一维线性 DPCodeForces-2153D Not Alone tag: 结论题,一维线性 DP给定一个环形序列 \(b\),长度为 \(m\),每次操作可以将一个数加一或减一。 问最少需要多少次操作,可以使序列 \(b\) 中每一个元素至少…

Codeforces Round 1062 (Div. 4)

A. Square?点击查看代码 #include <bits/stdc++.h>using i64 = long long;void solve() {int a, b, c, d;std::cin >> a >> b >> c >> d;if (a == b && b == c && c =…

一文吃透银行账务打通体系闭环 - 智慧园区

银行体系的复杂性,往往源于“账务、账户、会计、科目”之间的模糊边界。本文将系统拆解这四者的逻辑关系,从业务流、资金流到会计流,构建一套可理解、可复用的认知框架,帮助产品人真正打通银行产品设计的底层闭环。…

uups 逻辑合约也增加了升级函数,那总体不是也费gas吗?

这是一个很好的问题!虽然 UUPS 逻辑合约确实增加了升级函数,但它仍然比透明代理更省 Gas。以下是详细的原因和解释:1. UUPS 的升级函数对 Gas 的影响在 UUPS 模式中,升级逻辑(如 upgradeTo)确实存在于逻辑合约中…

【URP】Unity[纹理压缩]算法多平台对比

纹理压缩技术发展节点 ‌早期阶段 2000年代初‌ DXT/S3TC成为PC和主机平台主流,采用44像素块压缩,但移动端支持有限。 PVRTC(2008年)专为PowerVR GPU设计,要求纹理尺【从UnityURP开始探索游戏渲染】专栏-直达纹理…