基于GS(Gaussian Splatting)的机器人Sim2Real2Sim仿真平台

项目地址:RoboGSim

背景简介

        已有的数据采集方法中,遥操作(下左)是数据质量高,但采集成本高、效率低下;传统仿真流程成本低(下右),但真实度(如纹理、物理)欠佳,质量低;为了兼顾成本效率和数据真实性质量,本工作提出RoboGSim(上图),它一个高效、低成本的仿真平台,具有高保真渲染能力。它通过新场景、新物体和新视角实现演示合成,从而促进Policy学习的数据扩展。此外,它能够执行闭环模拟仿真以便对不同policy模型进行安全、公平和现实的评估。兼具低成本、高真实度的优势。

方法介绍

RoboGSim由四个模块组成:Gaussian Reconstructor, Digital Twins Builder, Scene Composer, Interactive Engine,流程如下图所示:

Gaussian Reconstructor

        本方法采用3DGS方法重建静态场景,然后对机器人手臂的关节进行点云分割。随后,我们利用MDH动态模型控制对应于每个关节的点云,从而实现机器手臂的动态渲染。3DGS利用一组多视角图像作为输入,以实现高保真场景重建。其将场景表示为一组高斯分布,并利用可微分光栅化渲染方法来实现实时渲染,能获得非常逼真的渲染图像。

Digital Twins Builder

        通过 Real2Sim 布局对齐和 Sim2GS 稀疏关键点对齐可以数字化现实世界,使数字资产在现实、模拟和 GS 表现之间保持一致。

        3D Assets Generation: 现实世界的物体采用COLMAP+3DGS进行重建,网络上的物体则使用Wonder3D+GaussianEditor进行重建;

        Layout Alignment: 使用测量和几何的方法将重建3DGS场景与仿真器isaac-sim中的布局进行对齐

Scene Composer     

        场景编辑:基于相机和手臂之间的内外参,将场景转换到机械臂所在的坐标系;

        对象编辑:使用上述同样的方法将操作对象转换到机械臂坐标系。

Interactive Engine

        Synthesizer:使用引擎生成大量的训练轨迹,包括机械臂的运动和目标物体的轨迹。这些轨迹驱动3DGS生成大量的逼真模拟数据集,用于Policy学习。这些多样化的数据包括新颖视角的渲染、场景组合和物体替换。

        EvaluatorIsaac Sim 输出物体和机械臂的状态,GS据此进行渲染。渲染图像被送入Policy网络预测下一帧动作,该动作被传递给仿真系统进行运动学逆向解析、碰撞检测和其他物理交互。Isaac Sim再将解析出的六轴相对姿态发送给GS渲染器,后者将渲染结果作为反馈发送回策略网络。这作为预测下一动作的视觉反馈,整个过程不断迭代,直到任务完成。

实验验证:从数据合成验证到闭环仿真

Real2Sim Novel Pose Synthesis

该实验目标是验证Real2Sim重建的性能,特别关注机器人手臂运动的准确性和图像纹理的保真度。静态场景是使用来自GT第一帧的机器人手臂初始姿势重建的。从真实机器人手臂收集的轨迹被用作驱动力,我们采用运动控制进行新姿态的渲染。RoboGSim 实现了31.3 PSNR0.79SSIM的渲染性能,同时保证了10 FPS的实时效率。

Sim2Real Trajectory Replay

该实验中轨迹是通过Issac Sim收集的,然后该轨迹用于驱动GS渲染取可乐的场景,同一轨迹用于驱动真实机器抓取可乐罐。如上比较结果表明模拟policy与机械臂的实际物理行为之间存在强一致性,突显了本系统中Sim2Real转移的有效性。这些结果表明,我们的仿真能够可靠地模拟现实世界的动态,促进从仿真到现实世界的成功策略转移。

RoboGSim as Synthesizer

本实验是为了验证RoboGSim合成数据的有效性,在真实世界和RoboGSim环境中各采集了1000条数据,前者耗时40h,后者仅耗时4h,然后用来训练自研VLA,上表中展示了两者的成功率,从中可以看出,纯仿真数据训练后的VLA在真实环境中具有一定的成功率,具有明显效果。

RoboGSim as Evaluator

本实验主要探讨将RoboGSim作为Evaluator的有效性。给定经过训练的VLA,将其部署于真实世界的机器人和RoboGSim中,RoboGSim能够再现与真实世界相似结果。对于类似糟糕案例,也能够避免真实世界中存在的问题,如碰撞。因此, RoboGSim作为评估器为policy提供了一个公平、安全和高效的评估平台。

结论

基于3DGS和IsaacSim的Real2Sim2Real仿真能高效合成高质量数据,目前成功率虽不及实采数据,但因其成本低和效率高,合成大量数据后有望达到实采数据的成功率,为通用操作大模型验证了一条可行路径。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/67197.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

「 机器人 」利用冲程对称性调节实现仿生飞行器姿态与方向控制

前言 在仿生扑翼飞行器中,通过改变冲程对称性这一技术手段,可以在上冲与下冲两个阶段引入不对称性,进而产生额外的力或力矩,用于实现俯仰或其他姿态方向的控制。以下从原理、在仿生飞行器中的应用和典型实验示例等方面进行梳理与阐述。 1. 冲程对称性原理 1.1 概念:上冲与…

MongoDB部署模式

目录 单节点模式(Standalone) 副本集模式(Replica Set) 分片集群模式(Sharded Cluster) MongoDB有多种部署模式,可以根据业务需求选择适合的架构和部署方式。 单节点模式(Standa…

微服务搭建----springboot接入Nacos2.x

springboot接入Nacos2.x nacos之前用的版本是1.0的,现在重新搭建一个2.0版本的,学如逆水行舟,不进则退,废话不多说,开搞 1、 nacos2.x搭建 1,首先第一步查询下项目之间的版本对照,不然后期会…

react-native网络调试工具Reactotron保姆级教程

在React Native开发过程中,调试和性能优化是至关重要的环节。今天,就来给大家分享一个非常强大的工具——Reactotron,它就像是一个贴心的助手,能帮助我们更轻松地追踪问题、优化性能。下面就是一份保姆级教程哦! 一、…

npm启动前端项目时报错(vue) error:0308010C:digital envelope routines::unsupported

vue 启动项目时,npm run serve 报下面的错: error:0308010C:digital envelope routines::unsupported at new Hash (node:internal/crypto/hash:67:19) at Object.createHash (node:crypto:133:10) at FSReqCallback.readFileAfterClose [as on…

改进候鸟优化算法之三:引入自适应策略的候鸟优化算法(AS-MBO)

引入自适应策略的候鸟优化算法(Migrating Birds Optimization with Adaptive Strategy,简称AS-MBO)是对传统候鸟优化算法(Migrating Birds Optimization,MBO)的一种改进。MBO算法本身是一种基于群体智能的元启发式优化算法,其灵感来源于候鸟迁徙时的“V”字形飞行队列,…

02-机器学习-核心概念

以下是机器学习核心概念的详细梳理。 1. 机器学习三大范式 类型定义典型应用监督学习使用带标签的数据训练模型,预测未知数据的标签。分类(邮件垃圾过滤)、回归(房价预测)无监督学习从无标签的数据中发现隐藏模式或结…

Redis实战(黑马点评)——关于缓存(缓存更新策略、缓存穿透、缓存雪崩、缓存击穿、Redis工具)

redis实现查询缓存的业务逻辑 service层实现 Overridepublic Result queryById(Long id) {String key CACHE_SHOP_KEY id;// 现查询redis内有没有数据String shopJson (String) redisTemplate.opsForValue().get(key);if(StrUtil.isNotBlank(shopJson)){ // 如果redis的数…

算法-加油站问题

hello 大家好!今天开写一个新章节,每一天一道算法题。让我们一起来学习算法思维吧! function canCompleteCircuit(gas, cost) {// 加油站的总数const n gas.length;// 记录总剩余油量,若总剩余油量小于 0,说明无法绕环…

讯飞绘镜(ai生成视频)技术浅析(二):大模型

1.讯飞星火大模型的基础架构 2.自然语言处理(NLP)技术的具体实现 3.脚本生成的具体过程与模型公式 4.分镜生成的具体过程与模型公式 5.视频生成与编辑的技术细节 6.关键技术公式的详细推导与解释 一、讯飞星火大模型的基础架构 讯飞星火大模型是基于Transformer架构的深…

【机器学习】深入探索SVM:支持向量机的原理与应用

目录 🍔 SVM引入 1.1什么是SVM? 1.2支持向量机分类 1.3 线性可分、线性和非线性的区分 🍔 小结 学习目标 知道SVM的概念 🍔 SVM引入 1.1什么是SVM? 看一个故事,故事是这样子的: 在很久以前的情人节&#xf…

pycharm 运行远程环境问题 Error:Failed to prepare environment.

问题排查 拿到更详细的报错信息: Help > Diagnostic Tools > Debug Log Settings section: 添加下面的配置 com.intellij.execution.configurations.GeneralCommandLine 重显报错,我这里是再次运行代码打开 Help | Collect Logs and Diagnosti…

一组开源、免费、Metro风格的 WPF UI 控件库

前言 今天大姚给大家分享一个开源、免费、Metro风格的 WPF UI 控件库:MahApps.Metro。 项目介绍 MahApps.Metro 是一个开源、免费、Metro风格的 WPF UI 控件库,提供了现代化、平滑和美观的控件和样式,帮助开发人员轻松创建具有现代感的 Win…

读写和解析简单的 nc 文件

NetCDF 文件格式在气象数据工程领域占据着举足轻重的地位,其结构灵活、强兼容性等优势使其成为该领域的一个标准。无论是从事学术研究还是工程实践,掌握这种数据格式变得越发重要。其次,我注意到目前社区中气象编程大多数课程都聚焦于某个特定…

Mac m1,m2,m3芯片使用nvm安装node14报错

使用nvm安装了node 12/16/18都没有问题,到14就报错了。第一次看到这个报错有点懵,查询资料发现是Mac芯片的问题。 Issue上提供了两个方案: 1、为了在arm64的Mac上安装node 14,需要使用Rosseta,可以通过以下命令安装 …

【计算机网络】host文件

host文件的主要功能: 域名解析 本地映射:host文件的主要功能是将**域名映射到相应的 IP 地址**。当计算机需要访问一个网站或服务时,它会首先在 host文件中查找该域名对应的 IP 地址。如果在 host文件中找到了匹配的域名和 IP 地址映射&…

vue3中customRef的用法以及使用场景

1. 基本概念 customRef 是 Vue3 提供的用于创建自定义响应式引用的 API,允许显式地控制依赖追踪和触发响应。它返回一个带有 get 和 set 函数的工厂函数来自定义 ref 的行为。 1.1 基本语法 import { customRef } from vuefunction createCustomRef(value) {retu…

周末总结(2024/01/25)

工作 人际关系核心实践: 要学会随时回应别人的善意,执行时间控制在5分钟以内 坚持每天早会打招呼 遇到接不住的话题时拉低自己,抬高别人(无阴阳气息) 朋友圈点赞控制在5min以内,职场社交不要放在5min以外 职场的人际关系在面对利…

C++和Python实现SQL Server数据库导出数据到S3并导入Redshift数据仓库

用C实现高性能数据处理,Python实现操作Redshift导入数据文件。 在Visual Studio 2022中用C和ODBC API导出SQL Server数据库中张表中的所有表的数据为CSV文件格式的数据流,用逗号作为分隔符,用双引号包裹每个数据,字符串类型的数据…

基于OpenCV实现的答题卡自动判卷系统

一、图像预处理 🌄 二、查找答题卡轮廓 📏 三、透视变换 🔄 四、判卷与评分 🎯 五、主函数 六、完整代码+测试图像集 总结 🌟 在这篇博客中,我将分享如何使用Python结合OpenCV库开发一个答题卡自动判卷系统。这个系统能够自动从扫描的答题卡中提取信…