三项神经突破变革机器人学习

news/2025/12/7 18:09:05/文章来源:https://www.cnblogs.com/codeshare1135/p/19318551

R²D²:三项变革机器人学习的神经突破

虽然在受控环境中,如今的机器人表现出色,但它们仍然难以应对现实世界任务所需的不可预测性、灵巧性和微妙交互——从组装精密部件到以类人的精确度操控日常物体。

机器人学习已成为弥合实验室演示与现实世界部署之间差距的关键。然而,传统方法面临根本性的限制:

  • 经典仿真器无法捕捉现代机器人系统的全部复杂性。
  • 人类演示难以在不同机器人实体之间迁移。
  • 人类视为理所当然的视觉与触觉的复杂协调,对机器而言仍然难以实现。

本文探讨了由某研究机构提出的三项开创性神经创新,这些创新正在改变机器人学习和适应的方式,并在 CoRL 2025 上展示:

  • NeRD(神经机器人动力学):通过学习的动力学模型增强仿真,该模型能在不同任务间泛化,同时支持在现实世界中进行微调。
  • Dexplore:将动作捕捉演示视为自适应引导,从而解锁人类水平的灵巧性。
  • VT-Refine:结合视觉和触觉感知,通过新颖的“现实-仿真-现实”训练来掌握精确的双手装配任务。

这些进步共同为开发者提供了技术、库和工作流程,以推进研究。

通过神经仿真教授机器人

仿真在机器人开发工作流程中扮演着关键角色。机器人可以在仿真中学习稳健地完成任务,因为在训练过程中可以对质量和摩擦等参数和属性进行随机化。然而,传统仿真器难以捕捉现代机器人的复杂性,这些机器人通常具有高自由度和复杂的机构。神经网络模型可以帮助应对这一挑战,因为它们能够高效预测复杂动力学并适应现实世界数据。

例如,NeRD 是一个用于预测特定机器人(或铰接刚体系统)在接触约束下未来状态的学习动力学模型。它可以替代分析仿真器中的底层动力学和接触求解器,从而实现混合仿真预测框架。

NeRD 使用一种机器人中心的状态表示,该表示强制执行空间不变性——这提高了 NeRD 的训练和数据效率,并极大地改善了泛化能力。NeRD 可以轻松集成到现有的铰接刚体仿真框架中。它已经通过与某物理模拟库的集成得到了验证,未来也将在某个物理引擎中作为众多求解器之一。

为了训练给定机器人的 NeRD 模型,需要收集 10 万条随机轨迹(每条 100 个时间步长)作为训练数据。NeRD 使用轻量级 GPT-2 Transformer 实现进行建模,并为六个不同的机器人系统训练了模型。

NeRD 模型在数千个时间步长上保持稳定和准确,对于某四足机器人的 1000 步策略评估,其累积奖励误差小于 0.1%。该方法还展示了在仿真中学习的某机械臂到达策略与 NeRD 集成后的零样本仿真到现实迁移能力,并且 NeRD 还可以在现实世界数据上进行微调,以进一步缩小仿真与现实之间的差距。

像 NeRD 这样的神经模型将加速机器人研究,使开发者能够准确地模拟复杂的全身训练,并与经典仿真技术相辅相成。

从人体运动学习灵巧技能

教授机器人手达到人类水平的灵巧性历来是一个难题。人类手拥有无与伦比的运动学复杂性、柔顺性和丰富的触觉感知组合。机器人手则自由度较少、驱动有限、传感和控制能力不足。这使得机器人难以从人类那里学习灵巧操作。

手-物体动作捕捉资料库提供了丰富的、富含接触信息的人类演示,但无法轻易用于机器人的直接策略学习。现有的工作流程包含三个主要部分:重定向、跟踪和残差校正,这些步骤会累积误差。

这项研究引入了参考范围探索,这是一种统一的单循环优化方法。它将重定向和跟踪整合起来,直接从动作捕捉数据训练可扩展的机器人控制策略。演示不被视为“严格”的地面实况,而是被视为软性指导。这保留了演示的意图,并使机器人能够自主发现与其自身实体兼容的运动。

工作流程的第二部分,学习一个基于视觉的生成控制策略,以提取基于状态的模仿控制策略。这使得机器人手能够利用从单视角深度图像获得的部分观察,以及稀疏的、用户定义的目标来操作物体。

在训练期间,策略的目标是让机器人手跟随给定的轨迹,以便执行多样化的物体操作技能,如抓取香蕉、手机、杯子和双筒望远镜。该模型由一个编码器、一个先验网络和一个解码器策略组成。在推理时,编码器被省略,潜在嵌入直接从学习的先验中采样,从而产生一个能够仅根据部分观察执行有效的目标条件灵巧操作的生成控制策略。

这种方法在某灵巧手上的成功率提高了近 20%。它在某灵巧手和另一个灵巧手平台上均始终优于各个基线方法。基于状态的策略根据其模仿人类演示和在未见场景中泛化的能力进行评估,而基于视觉的策略框架则在仿真中的操作和成功迁移到现实世界方面进行评估。

结合视觉与触觉进行精确双手装配

人类擅长操作和双手装配任务,因为他们在过程中依赖视觉和触觉反馈。想象用双手进行插头和插座的组装。首先,您会通过视觉识别并抓取所需的部件。接下来,在组装部件时,触觉反馈起着重要作用,因为仅凭视觉反馈(存在遮挡)难以完成任务。

使用扩散策略的行为克隆是有用的,但受到现实世界演示数据有限以及数据收集界面触觉反馈限制的影响。

为了解决这个数据问题,VT-Refine 开发了一个新颖的“现实-仿真-现实”框架,结合仿真、视觉和触觉来解决双手装配任务的这个问题。该框架步骤的高级概述包括:

  1. 收集少量现实世界演示(例如 30 个回合)来预训练一个双手视觉触觉扩散策略。
  2. 在并行化的仿真环境中,使用强化学习 对该策略在其数字孪生体上进行微调。
  3. 将此策略部署回现实世界。

用于触觉感官输入的仿真建立在 TacSL 之上,这是一个基于 GPU 的触觉仿真库,与某机器人仿真平台集成。这实现了更好的仿真到现实可迁移性,因为可以在 GPU 加速的仿真中利用对触觉传感器柔软性的高效近似,从而实现可扩展的训练。用于训练的观察包括:

  • 由以自我为中心的相机捕获的点云。
  • 触觉传感器反馈的点云表示。
  • 手臂和夹爪的关节位置。

收集的数据随后用于预训练扩散策略。为了在仿真中进行规模化训练,设置了带有视觉和触觉传感器的场景数字孪生体。对人类演示的预训练提供了一个强大的先验,指导强化学习的探索,而无需复杂的奖励工程。

经过 RL 微调的策略通过引入必要的探索,显著提高了高精度装配任务的性能。它在现实世界中的成功率在仅视觉变体上提高了约 20%,在视觉触觉变体上提高了约 40%。仿真到现实的迁移性能有大约 5-10% 的轻微下降,这与通过仿真中的 RL 微调带来的超过 30% 的成功率提升相比是微不足道的。

这项工作是首批成功实现双手视觉触觉策略大规模仿真到现实迁移的研究之一。

总结

机器人学习的进步正在改变机器人如何从仿真中获取复杂技能并迁移到现实世界。NeRD 实现了更准确的动力学预测,RSE 简化了从人类演示中学习灵巧操作的过程,而 VT-Refine 则结合视觉和触觉实现了稳健的双手装配。这些方法共同展示了可扩展的、数据驱动的学习如何正在缩小机器人能力与人类能力之间的差距。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/991673.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025广东正达松远智能科技实力榜:给汤机与重力铸造自动化领跑,六家高潜力本土品牌深度解析

2025广东正达松远智能科技实力榜:给汤机与重力铸造自动化领跑,六家高潜力本土品牌深度解析 在制造业向智能化、精密化转型的浪潮中,压铸与机加工领域的自动化水平已成为衡量企业核心竞争力的关键指标。其中,给汤机…

2025 最新墙面艺术涂装服务商 / 厂家 TOP5 评测!技术创新 + 美学赋能权威榜单发布,重新定义空间装饰新体验,肌理壁膜 艺术漆 墙面艺术涂装 高端艺术漆

随着人们对居住与商业空间美学需求的不断提升,墙面艺术涂装已成为打造个性化与高品质环境的核心元素。本榜单基于技术实力、产品体系、服务网络、环保性能及行业影响力五大维度,结合市场反馈与专业评测,权威解析202…

深入解析:回溯剪枝的“减法艺术”:化解超时危机的 “救命稻草”(三)

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025铁氟龙高温线厂家实力榜:明秀电子以极细线径技术领跑,六家高潜力本土品牌深度解析

2025铁氟龙高温线厂家实力榜:明秀电子以极细线径技术领跑,六家高潜力本土品牌深度解析 在高端制造与精密电子领域,特种线缆扮演着至关重要的“血管”与“神经”角色。其中,铁氟龙高温线以其卓越的耐高温、耐腐蚀、…

Ubuntu 搜狗输入法安装

本文于 2019年3月9日 编写 安装搜狗输入法之前,先执行以下命令 sudo apt-get update sudo apt-get install fcitx-bin sudo apt-get install fcitx-table 执行成功之后,打开“区域与语言语言”里面的“管理已安装的语…

图解IIS8上解决ASP.Net第一次访问慢的处理

图解IIS8上解决ASP.Net第一次访问慢的处理Posted on 2025-12-07 17:57 billpeng 阅读(0) 评论(0) 收藏 举报看这里!!!!图解IIS8上解决ASP.Net第一次访问慢的处理-百度经验 本篇经验以IIS8,Windows Server 20…

2025工业制冷设备实力榜:凯诺机械以高效节能技术领跑,六家国产冷水机厂家核心优势深度解析

2025工业制冷设备实力榜:凯诺机械以高效节能技术领跑,六家国产冷水机厂家核心优势深度解析 工业制冷设备,作为现代制造业的“温度心脏”,其性能的优劣直接关系到生产线的稳定性、产品的良品率以及企业的能耗成本。…

2025电热元件厂家实力榜:赫斯特(东莞)电热科技以创新热流道发热圈领跑,六大核心发热组件深度解析

2025电热元件厂家实力榜:赫斯特(东莞)电热科技以创新热流道发热圈领跑,六大核心发热组件深度解析 在现代工业制造体系中,电热元件作为能量转换的核心部件,其性能的优劣直接关系到生产设备的效率、能耗与最终产品…

python题库 No.28 shopping

阿文去超市购物,买的商品单价为列表price和数量为列表num。 他结算时发现苹果单价错了,本来应该是5.5元一斤的,却写出了55 请帮他修改苹果单价,定义函数sum(),传入参数price和num,计算商品总价money。 最后格式化…

2025东莞中控自动化冲压机械手实力榜:六家国产高精度摆臂与二次元拉伸技术代表企业深度解析

2025东莞中控自动化冲压机械手实力榜:六家国产高精度摆臂与二次元拉伸技术代表企业深度解析 在制造业向智能化、自动化加速转型的浪潮中,冲压自动化设备作为提升生产效率、保障产品质量与稳定性的核心装备,其重要性…

博客4

作业①: o 要求: ▪ 熟练掌握 Selenium 查找 HTML 元素、爬取 Ajax 网页数据、等待 HTML 元素等内 容。 ▪ 使用 Selenium 框架+ MySQL 数据库存储技术路线爬取“沪深 A 股”、“上证 A 股”、 “深证 A 股”3 个板块…

【OPENGL ES 3.0 学习笔记】第十七天:模型矩阵、视图矩阵与投影矩阵 - 详解

【OPENGL ES 3.0 学习笔记】第十七天:模型矩阵、视图矩阵与投影矩阵 - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-fami…

2025 AI 搜索品牌监测工具选型指南:主流系统推荐与排名洞察解决方案

2025 AI 搜索品牌监测工具选型指南:主流系统推荐与排名洞察解决方案随着生成式 AI 成为品牌曝光核心渠道,企业对 “AI 搜索品牌推荐与排名监测工具” 的需求持续攀升。京报网 2025 年 11 月报道指出,国内企业选择此…

有名的汽配车间通风降温工业冷风机源头厂家,工厂降温车间/生产车间通风降温/敞开式车间通风降温/工厂车间降温通风工业冷风机厂家哪家好

在工业制造领域,尤其是汽配、机械加工等精密作业车间,高温闷热的环境不仅直接影响员工的工作舒适度与生产效率,更可能对设备精度、产品质量构成潜在威胁。如何经济、高效地实现大面积厂房的通风降温,成为众多制造企…

2025广东鉴正智能设备厂家实力榜:全自动电镀与龙门滚镀设备六家创新技术代表深度解析

2025广东鉴正智能设备厂家实力榜:全自动电镀与龙门滚镀设备六家创新技术代表深度解析 随着制造业向智能化、绿色化深度转型,表面处理行业正经历一场由自动化与环保技术驱动的深刻变革。全自动电镀设备、龙门式生产线…

20

20躺了一天。

2025自动提升机厂家实力排行榜:东莞垚林机械以智能高效技术领跑,六家创新本土品牌深度解析

2025自动提升机厂家实力排行榜:东莞垚林机械以智能高效技术领跑,六家创新本土品牌深度解析 在工业自动化浪潮持续深入的今天,提升机作为物料垂直输送的核心设备,其智能化、高效化水平已成为衡量生产线现代化程度的…

Fibonacci 数列求余数和尾递归的一次实践

Fibonacci数列求余数和尾递归的一次实践 作者:LOYISHEN 时间:2020年01月19日 关键词:Fibonacci数列、求余数、递归、尾递归 背景 在练习蓝桥杯的试题时,有一道题是求Fibonacci数列中第n个数对10007取余数的题目(轻…

2025高压加速老化试验箱实力榜:东莞伟煌以创新热流仪技术领跑,六家国产精密设备厂商深度解析

2025高压加速老化试验箱实力榜:东莞伟煌以创新热流仪技术领跑,六家国产精密设备厂商深度解析 在电子、半导体、新能源、航空航天等高端制造领域,产品的长期可靠性与耐久性是决定其市场竞争力的核心要素。高压加速老…