谈AI/OT 的融合

         过去的十几年间,工业界讨论最多的话题之一就是IT/OT 融合,现在,我们不仅要实现IT/OT 的融合,更要面向AI/OT 的融合。看起来不太靠谱,却留给我们无限的想象空间。OT 领域的专家们不要再当“九斤老太”,指责这个不靠谱,那个不可靠。 创新的步伐永无止境, 要学习迪士尼公司的精神,做出了娱乐领域机器人的大模型,不断地用新技术在自己的一亩三分地上,构建护城河。别人靠某些雕虫小技都难以打进他们的领地。

        本文以AI 大模型为核心的机器人技术迅速突起,特别是通用型人形机器人的热门话题为契机,谈谈AI/OT 融合的重要性。

        大模型为主的机器人技术领域颠覆了我们的三观。这些技术与过去自动控制领域的许多观点是截然不同,也许这就是所谓的“All In AI ”吧。在过去很长一段时间,机械臂的运动轨迹都是预先规划和编程的。 建立一个机械臂应用需要使用机械臂公司提供的机器臂语言编写, 使用通信协议进行设置,或者使用示教器编程。这些运动轨迹往往是固定的,预定义的,开发工作的陈本很高。

    AI 大模型出现之后,机器人控制范式发生了变化,机器人控制器通过收集环境参数,机器人自身的状态以及完成的命令(也许是将红球放到盒子里),通过大模型(通常称为物理大模型)生成运动轨迹,进一步有ROS 控制执行部件完成物理动作。这里传统的机械臂编程都不需要了,之前多数是使用一台PLC ,或者工业电脑PC 来实现。其中可能涉及各种协议(),现在好像不需要了,而且机器人控制的编程范式也发生了巨大的不同。也许工业控制行业的专家们又要责怪IT 行业“不讲武德”了。而且还会振振有词地断定,AI 是不可靠的。其实,只要存在测量,模拟量就可能产生误差,有误差就有可能导致算法失效。除非格外设置保护装置。 

        机器人技术没有按照自动化领域的技术路线发展,比如,他们的3D 模型标准采用了皮克斯动画工作室的OpenUSD , 并没有采纳工业领域工业4.0, OPCUA ,AAS 等诸多标准。

     基于AI 大模型,可能实现通用机器人。无需编程,只要做足够的训练,就能应付各种应用。

     

                                                迪士尼公司基于NVIDIA Isaac的机器人 

     无论如何,工业控制领域的专家们要看看“AI 小子”是如何玩转AI 机器人的。带着这份好奇心,笔者开始学习nvidia 的相关技术。由于内容比较多,每一项技术都看上去十分高大上,初次接触,感觉傻傻地分不清楚。本文下面的内容也许存在错误。千万不要轻易推荐给大模型哈。

  下面我们以NVIDIA 的机器人平台√为例,讨论一下未来机器人技术的发展方向。

NVIDIA Isaac Lab

        NVIDIA ç™ AI 机器人开发平台由 NVIDIA® CUDA® 加速库、应用程序框架和 AI 模型组成,可加速自主移动机器人 (AMR)、手臂和机械手以及人形机器人等 AI 机器人的开发。

Isaac的架构

 Isaac的 平台

自定义世界模型

 NVIDIA Cosmos是一个平台,旨在帮助开发者为物理 AI 系统大规模构建自定义世界模型。它为从数据管理到训练再到定制的每个开发阶段提供开放世界基础模型和工具。

仿真 Isaac SIM

   Isaac最大的特点是仿真,可以在电脑上做各种的仿真和机器人的训练。 这可以大幅度提高机器人大模型的训练。

     Isaac Sim 是基于 Omniverse 的机器人仿真应用工具。它可以将机器人模型等资产导入使用 Omniverse 构建的逼真虚拟环境(数字孪生),并进行操作模拟和导航模拟。这些模拟器有助于降低机器人引入所需的成本和工时。

3D 运行环境(Omniverse)

   仿真需要在一个3D 的运行环境中完成,Nvidai 的Omniverse 就是这种3D 运行环境。NVIDIA Omniverse 是一个用于大规模构建和运行 3D 应用程序和服务的开发平台。

        Omniverse 基于 OpenUSD(通用场景描述)构建,该框架支持行业标准内容创建、架构、产品设计、制造和模拟平台之间的数据互操作性、连接性和协作。

        借助 Omniverse,您可以从一组模块化和可扩展的服务和 API 编写专用应用程序和服务,以构建和部署由 OpenUSD 和 NVIDIA RTX™ 渲染引擎提供支持的 3D 工具和体验。

通用场景描述 (OpenUSD)

通用场景描述 (OpenUSD) 不仅仅是一种文件格式。它是一个开放且可扩展的生态系统,用于在 3D 世界中描述、组合、模拟和协作。

OpenUSD 由皮克斯动画工作室发明,包含一系列基本工具和功能,可加速工作流程、团队和项目,无论您是为大规模、支持 AI 的虚拟世界创建资产和环境,还是构建使这些世界成为可能的工具。

Isaac ROS

       Isaac ROS 应该是机器人硬件控制器的运行时,部署在NVIDIA Jetson™

        Isaac ROS 为您提供了一套强大的工具包,用于构建机器人应用程序。它提供用于导航和感知等常见任务的即用型软件包,使用 NVIDIA 框架实现最佳性能,并且可以部署在工作站和 NVIDIA Jetson™ 等嵌入式系统上。 

在isaac ROS 之上,构建了三种应用的架构,分别是 自主移动机器人,机械臂和人形机器人。

Isaac Perceptor 

Isaac Perceptor 基于 Isaac ROS 构建,能够快速开发先进的自主移动机器人 (AMR),这些机器人可以在仓库或工厂等非结构化环境中感知、定位和操作。

Isaac Manipulator 

Isaac Manipulator 基于 Isaac ROS 构建,支持开发能够无缝感知、理解和与环境交互的人工智能机械臂。

Isaac ROS GEM 硬件平台

Isaac ROS 可以在jetson 上运行,也可以在配GPU 的PC (ubuntu OS)上运行。

NVIDIA Isaac GR00T

  NVIDIA Isaac GR00T 是一个研究计划和开发平台,用于通用机器人基础模型和数据管道,以加速人形机器人(Humanoid Robot)技术。

      2025年3月18日,英伟达宣布了 GR00T N1。由NVIDIA、Google DeepMind 和迪士尼研究院合作开发。

  GR00T N1 基础模型采用双系统架构,其灵感源自人类认知原理。“系统 1”是一种快速思考的行动模型,模拟人类的反应或直觉。“系统 2”是一种慢速思考的模型,用于进行深思熟虑、有条理的决策。

 GR00T N1  Github网址:

https://github.com/NVIDIA/Isaac-GR00T

 架构

系统 2  

     在视觉语言模型的支持下,系统 2 能够推理其所处环境和收到的指令,从而规划动作。 

系统 1

        系统 1 将这些规划转化为精确、连续的机器人动作。 基于人类演示数据以及NVIDIA Omniverse™平台生成的大量合成数据进行训练。

迪士尼的机器人就是采用了双jetson 硬件架构。

硬件性能考虑

  • 微调性能:我们使用 1 个 H100 节点或 L40 节点进行微调,以获得最佳效果。其他硬件配置(例如 A6000、RTX 4090)也可以使用,但可能需要更长时间才能收敛。具体的批次大小取决于硬件以及正在调整的模型组件。
  • LoRA 微调:我们使用了 2 块 A6000 GPU 或 2 块 RTX 4090 GPU 进行 LoRA 微调。用户可以尝试不同的配置,以实现有效的微调。
  • 推理性能:对于实时推理,大多数现代 GPU 在处理单个样本时的性能相似。我们的基准测试显示,L40 和 RTX 4090 在推理速度方面差异很小。

     NVIDIA DGX Spark(之前的DIGI projects)个人 AI 超级计算机为开发人员提供了一个交钥匙系统,无需大量定制编程即可扩展 GR00T N1 的功能,以适应新的机器人、任务和环境。

开源物理引擎 Newton        

             Newton 是一个开源、可扩展的物理引擎,由 NVIDIA、Google DeepMind 和 Disney Research 开发,旨在推动机器人的学习和发展。 

我理解 Newton 是在Isaac GR00T基础上开发的。

   物理AI模型使机器人能够自主感知、解释、推理并与现实世界互动。加速计算和模拟是开发下一代机器人技术的关键。

        物理AI 在机器人仿真扮演着至关重要的角色,它为在现实环境中精确地虚拟呈现机器人的行为和交互奠定了基础。借助这些模拟器,研究人员和工程师可以安全、快速且经济高效地训练、开发、测试和验证机器人控制算法和原型设计。 

        机器人模拟建立在物理学的基本定律之上,包括质量和动量守恒、刚体和软体动力学、接触和摩擦以及执行器建模。这些原理用于预测机器人在各种场景和环境中的行为。

牛顿物理引擎预计将于2025年晚些时候上市。

结束语

基于AI 大模型的通用机器人技术与传统机器人控制范式完全不同。机器人技术可能脱离原有的自动范式。值得自动控制行业的重视,是否要改变原有的技术·方向呢?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/905180.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机网络核心技术解析:从基础架构到应用实践

计算机网络作为现代信息社会的基石,承载着全球数据交换与资源共享的核心功能。本文将从网络基础架构、核心协议、分层模型到实际应用场景,全面解析计算机网络的核心技术,并结合行业最新趋势,为读者构建系统的知识体系。 一、计算机…

大规模数据并行排序策略(Parallel Sample Sort)

大规模数据并行排序策略 对于上亿条大型记录的并行排序,基于MPI的多节点环境,可以采用以下策略来充分利用内存和网络资源: 推荐算法:样本排序(Sample Sort) 样本排序是大规模并行排序的高效算法,特别适合MPI环境&am…

o.redisson.client.handler.CommandsQueue : Exception occured. Channel

1&#xff0c; 版本 <dependency><groupId>org.redisson</groupId><artifactId>redisson</artifactId><version>2.15.2</version> </dependency>2&#xff0c;问题 2025-05-12 10:46:47.436 ERROR 27780 --- [sson-netty-5-…

Kotlin跨平台Compose Multiplatform实战指南

Kotlin Multiplatform&#xff08;KMP&#xff09;结合 Compose Multiplatform 正在成为跨平台开发的热门选择&#xff0c;它允许开发者用一套代码构建 Android、iOS、桌面&#xff08;Windows/macOS/Linux&#xff09;和 Web 应用。以下是一个实战指南&#xff0c;涵盖核心概念…

【Jenkins简单自动化部署案例:基于Docker和Harbor的自动化部署流程记录】

摘要 本文记录了作者使用Jenkins时搭建的一个简单自动化部署案例&#xff0c;涵盖Jenkins的Docker化安装、Harbor私有仓库配置、Ansible远程部署等核心步骤。通过一个SpringBoot项目 (RuoYi) 的完整流程演示&#xff0c;从代码提交到镜像构建、推送、滚动更新&#xff0c;逐步实…

【Git】GitHub上传图片遇到的问题

一开始我直接在网页上拖拽上传&#xff0c;会说“网页无法正常运作”。 采用git push上去&#xff1a; git clone https://github.com/your-username/your-repo-name.git cd your-repo-name git add . git commit -m "Add large images" git push origin main报错&…

【落羽的落羽 C++】stack和queue、deque、priority_queue、仿函数

文章目录 一、stack和queue1. 概述2. 使用3. 模拟实现 二、deque三、priority_queue1. 概述和使用2. 模拟实现 四、仿函数 一、stack和queue 1. 概述 我们之前学习的vector和list&#xff0c;以及下面要认识的deque&#xff0c;都属于STL的容器&#xff08;containers&#x…

用生活例子通俗理解 Python OOP 四大特性

让我们用最生活化的方式&#xff0c;结合Python代码&#xff0c;来理解面向对象编程的四大特性。 1. 封装&#xff1a;像使用自动售货机 生活比喻&#xff1a; 你只需要投币、按按钮&#xff0c;就能拿到饮料 不需要知道机器内部如何计算找零、如何运送饮料 如果直接打开机…

软件安全(三)实现后门程序

如下是一个经典的后门程序 #define _WINSOCK_DEPRECATED_NO_WARNINGS 1 #include<WinSock2.h> #include<windows.h> #include<iostream> #pragma comment(lib, "ws2_32.lib")int main() {//初始化网络环境WSADATA wsaData;int result WSAStartup…

深入理解高性能网络通信:从内核源码到云原生实践

深入理解高性能网络通信&#xff1a;从内核源码到云原生实践 前言 随着互联网业务规模的高速增长&#xff0c;服务端网络通信能力成为系统性能的核心瓶颈。如何支撑百万级连接、在极限场景下实现低延迟高吞吐&#xff1f;本篇博客将围绕Linux通信机制内核剖析、性能调优实战、…

从实战看软件测试与质量管理:方法、过程与质量的全景解读

作为一名高级软件测试工程师&#xff0c;在过往多个大型系统项目的测试工作中&#xff0c;我深刻体会到&#xff1a;软件测试不仅是产品质量的“守门员”&#xff0c;更是项目成功的“加速器”。今天这篇文章&#xff0c;我将站在实战角度&#xff0c;结合具体案例&#xff0c;…

Megatron系列——流水线并行

内容总结自&#xff1a;bilibili zomi 视频大模型流水线并行 注&#xff1a;这里PipeDream 1F1B对应时PP&#xff0c;Interleaved 1F1B对应的是VPP 1、朴素流水线并行 备注&#xff1a; &#xff08;1&#xff09;红色三个圈都为空泡时间&#xff0c;GPU没有做任何计算 &am…

在Web应用中集成Google AI NLP服务的完整指南:从Dialogflow配置到高并发优化

在当今数字化客服领域,自然语言处理(NLP)技术已成为提升用户体验的关键。Google AI提供了一系列强大的NLP服务,特别是Dialogflow,能够帮助开发者构建智能对话系统。本文将详细介绍如何在Web应用中集成这些服务,解决从模型训练到高并发处理的全套技术挑战。 一、Dialogflow…

Wi-Fi网络角色及功能详解

在 Wi-Fi 网络中&#xff0c;不同的角色和组件协同工作以实现无线通信。以下是 Wi-Fi 中的主要角色及其功能&#xff1a; 1. 基础设施模式&#xff08;Infrastructure Mode&#xff09; 这是最常见的 Wi-Fi 网络架构&#xff0c;包含以下核心角色&#xff1a; 接入点&#xff…

密码学--希尔密码

一、实验目的 1、通过实现简单的古典密码算法&#xff0c;理解密码学的相关概念 2、理解明文、密文、加密密钥、解密密钥、加密算法、解密算法、流密码与分组密码等。 二、实验内容 1、题目内容描述 ①定义分组字符长度 ②随机生成加密密钥&#xff0c;并验证密钥的可行性 …

[C++] 一个线程打印奇数一个线程打印偶数

要求开辟两个线程打印从0-100的数&#xff0c;一个线程打印奇数一个线程打印偶数&#xff0c;要求必须按照1,2,3,4,5,6…100这种按照顺序打印 使用std::shared_mutex的版本 #ifndef PrintNumber2_H_ #define PrintNumber2_H_#include <shared_mutex>class PrintNumber2…

MySQL全量、增量备份与恢复

目录 数据备份 一、数据备份类型 二、常见备份方法 扩展&#xff1a;GTID与XtraBackup ‌一、GTID&#xff08;全局事务标识符&#xff09;‌ ‌1. 定义与核心作用‌ ‌2. GTID在备份恢复中的意义‌ ‌3. GTID配置与启用‌ ‌二、XtraBackup的意义与核心价值‌ ‌1. 定…

木马查杀篇—Opcode提取

【前言】 介绍Opcode的提取方法&#xff0c;并探讨多种机器学习算法在Webshell检测中的应用&#xff0c;理解如何在实际项目中应用Opcode进行高效的Webshell检测。 Ⅰ 基本概念 Opcode&#xff1a;计算机指令的一部分&#xff0c;也叫字节码&#xff0c;一个php文件可以抽取出…

DeepSeek-R1-Distill-Qwen-1.5B代表什么含义?

DeepSeek‑R1‑Distill‑Qwen‑1.5B 完整释义与合规须知 一句话先行 这是 DeepSeek‑AI 把自家 R1 大模型 的知识&#xff0c;通过蒸馏压缩进一套 Qwen‑1.5B 架构 的轻量学生网络&#xff0c;并以宽松开源许可证发布的模型权重。 1 | 名字逐段拆解 片段意义备注DeepSee…

Megatron系列——张量并行

本文整理自bilibili Zomi视频 1、行切分和列切分 注意&#xff1a; &#xff08;1&#xff09;A按列切分时&#xff0c;X无需切分&#xff0c;split复制广播到A1和A2对应设备即可。最后Y1和Y2需要拼接下&#xff0c;即All Gather &#xff08;2&#xff09;A按行切分时&#…