人形机器人,自动驾驶“老炮”创业第二站

造一台人形机器人,或许正在成为2025年最炙手可热的事情。

从去年第四季度开始,伴随着大模型应用的深入,具身智能概念被点燃,其中最鲜明的一个特点是,大量自动驾驶大佬的转行加入。

随便说几个比较有分量的,智驾芯片上市公司地平线创始成员、副总裁、前软件平台产品线总裁余轶南(博士)联手理想汽车前智能驾驶产品总监赵哲伦成立具身智能领域初创公司维他动力;

百度集团资深副总裁、CEO助理、原百度智能驾驶事业群组(IDG)负责人李震宇加盟具身智能赛道初创公司它石智航;

前小米其次自动驾驶产品技术负责人和量产负责人刘方成立具身智能概念公司阿米奥机器人……

左手造车,右手造人,自动驾驶“老炮”们的创业没有止境。

01车企也来分羹

事实上,除了上文提到了几位近期涉足具身智能行业的前自动驾驶从业者之外,还有不少自动驾驶行业重量级大佬在很早之前就已经入局。

原文远知行COO张力2023年6月离职后不到半年即加入人形机器人公司逐际动力,担任联合创始人兼COO,全面负责公司在全球范围内的战略规划、渠道拓展、项目实施、市场营销以及政府关系事务。

曾在Waymo和Momenta担任重要技术职位的高继扬2023年5月创立了具身智能公司星海图(StarSeer AI),并担任CEO。公司成立后不就即获得了由IDG资本、BV百度风投等在内的顶级投资机构千万级美元的投资。

2023年4月,曾在小鹏汽车和OPPO担任首席科学家的郭彦东创立智平方(Shenzhen AI Square)科技有限公司,担任创始人兼首席执行官,如今公司自研的多模态大模型——AI2R Brain,能够驱动Alpha Bot机器人在多样化的场景中实现高精度感知与自然交互。

此外,还有其他一些转行到具身智能赛道的自动驾驶精英。

孙兆治:珞博智能高管,曾任小鹏机器人产品设计负责人,滴滴出行的造车项目中担任产品负责人。

王凡:原纵目科技CTO,后加入北斗智联科技有限公司,出任CTO。

王荣兴:Momenta负责产品工程研发的副总裁,离职后进行大模型创业,2023年6月创立万仞AI。

陈俊波:菜鸟网络“E.T.物流实验室”无人车算法负责人,离开阿里之后,与前阿里机器人CEO谷祖林等人共同创办了“有鹿机器人”,进军户外清洁机器人领域。

肖军:前京东集团副总裁、京东物流X事业部总裁,选择了仓储机器人领域进行创业,创办天下先智创机器人,并获得了来自零一创投、经纬创投、红点中国的2亿元投资。‍

一个有意思的现象,自动驾驶“老炮”们转入具身智能赛道扎堆创业,车企们也不甘落后,也集体布局具身智能。

去年12月26日,广汽集团发布自主研发的第三代具身智能人形机器人——GoMate是车企布局具身智能赛道的最新动态。

GoMate是一款全尺寸的轮足人形机器人,全身拥有38个自由度。广汽集团机器人研发团队负责人张爱民博士表示,广汽集团计划2025年实现自研零部件批量生产,并率先在广汽传祺、埃安等主机厂车间生产线和产业园区开展整机示范应用;2026年实现整机小批量生产,并逐步扩展至大规模量产。

稍早前的2024理想AI Talk中,理想汽车CEO李想回应是否会做人形机器人时表示,概率上肯定是100%,李想还强调,理想是一家人工智能企业,要做的不是汽车的智能化,而是人工智能的汽车化,并将推动人工智能普惠到每一个家庭。

11月6日的小鹏汽车“AI科技日”上,小鹏汽车也亮相了全新一代人形机器人“Iron艾伦”,该款人形机器人已经进入小鹏汽车广州工厂进行了小鹏P7+车型的生产实训,未来将会聚焦在工厂和线下门店等场景。

除了亲自下场之外,还有车企通过联合合作伙伴或者投资的形式来布局具身智能。

奇瑞汽车就联手AI公司Aimoga共同研发了人形机器人Mornine,进军人形机器人赛道;上汽创投则参与了人形机器人本体企业智元机器人的A3轮战略融资,上汽集团以投资机器人企业的形式切入人形机器人领域。

02相同的技术内核

造车和造人两条赛道之所以能够随意融合,很大程度还是源于技术的同源,即都是基于对环境的感知和交互,对外界信息进行计算后,指导机器进行运动的过程,从本质来看,两者都需要具有智慧的大脑,只是外在表现的物理形体的不同。

原特斯拉自动驾驶部门的负责人Andrej Karpathy近期接受访谈时也表示:汽车也是机器人,在从汽车到人形机器人Optimus的技术转移中,工作量其实不大,而且工具都是现成的,只是从汽车转移到机器人上,系统被重新配置,但本质上还是相同的。

虽然技术同源,然而在实际应用层面,自动驾驶和具身智能还是要面对不同类型、不同等级的数据处理需求和计算能力。

从计算规模来看,自动驾驶的高速场景较多,并且和安全关系紧密,所以需要较高算力的芯片支持实时计算;而智能机器人,在现阶段通常在相对低速环境中工作,相应的计算需求会降低。

地平线联合创始人&CTO黄畅曾对自动驾驶领域行业的基础算力进行过说明,L2级需10 TOPS左右;L2+则需要几十TOPS;L3需要100 TOPS以上;L4需要1000 TOPS,要充分满足L4级要求,甚至需要几千个TOPS。

然而对机器人大模型来说,以能够推理7B大模型的单张NVIDIA A100举例,其TOPS峰值达1248,因而,建立云边端协同的数字算力环境,对保障各类机器人的感知、计算和处理能力至关重要。

在运动控制的维度上,自动驾驶只需要控制2D维度的运动,而人形机器人仅手部的抓取这一项,就需要模仿生物体多达20个以上的关节运动,这对计算和控制提出了更高的挑战。

此外,自动驾驶面对的数据相对“标准化“,大多是车道线、信号灯等在一定规则内运行的内容,机器人不同,它们工作的场景复杂多变,这就导致数据种类也会相应变多且发散,这同样对计算能力提出了一定的要求。

以当前已经有规模应用的酒店服务机器人为例,虽然工程师们通过强化机器人的地图构建能力,应用VSLAM技术进行机器识别并标定禁行线,强化避障算法和传感等方式,已经能够让机器人极可能的避免与行人发生冲突,并能更好、更灵敏地识别地面上障碍物。

现在,酒店场景下至少有三种环境的变化会对机器人的运行产生影响。

物理环境方面,因清洗地毯、会议设备设施、装饰品摆放等地面环境的改变,或造成机器人识别故障,使得机器人路径识别错误;

社会环境方面,在电梯中与人或其他发生优先乘坐电梯的纠纷;

数字环境方面,酒店组网方式让机器人在电梯或角落位置出现的通信失败等等。

马斯克曾表示,特斯拉现有的 FSD 技术,可以在未来和机器人模块进行一定程度的算法复用,但仍然只是在“底层模块”中进行,“更高阶的计算和场景还是需要针对机器人平台进行专项开发。”

李想也说,如果我们连L4级跟自动驾驶的汽车都解决不了,怎么去解决更复杂的?因为车是个无接触机器人,而且道路是标准化的,包括道路上的提示和参与者都是标准化的,而且每个人都受交通规则的 训练,我觉得这已经是最简单的机器人了,如果车没法实现,其实其他人工智能机器人,还是非常有限的。 

03把价格打下来

在具身智能的竞争中,商业化是创业者们面对的共同难题,特斯拉去年的股东大会上,马斯克首次谈到人形机器人初创公司,“原型很容易,批量生产很难,甚至不可能”,其中的原因不光在于软件算法和硬件传感器等,更在于生产和工程能力,说的直白一些,就是生产出来的产品有合适的价格,能够被用户所接受。

我们先来看软件算法。

从底层算法模型来看,具身智能的软件可以分为大脑和小脑。

大脑负责感知并模拟人类的思维决策过程,小脑则是模仿生物进行复杂的运动控制。

大脑算法中的环境感知和理解和自动驾驶一样,都主要基于机器视觉,发展已经比较成熟了,目前很多具身智能创业公司多依托科技大厂的多模态大模型赋能。

比如,Figure AI旗下Figure 02和1X Technologies旗下EVE、NEO均接入OpenAl端到端的大语言-视觉(VLM)模型;

乐聚机器人旗下“夸父”接入华为盘古具身智能大模型;

优必选旗下walker S接入百度文心一言大模型;

星动纪元旗下“小星”系列接入阿里通义千问和智谱清言两家大模型;

智元机器人多模态通用大模型用的是讯飞星火大模型(操作大模型自研)等。

这些大厂的大模型在基础能力上都有不错的表现,也各有自己擅长的长板,在这方面,创业公司们的起点大致相同,差异不大。

可是在运动控制的小脑算法方面,各家就显示出不同的技术路径。

最典型的案例,人形机器人的控制算法发展,已经经历了基于模型的控制算法(LIPM+ZMP)、动态模型控制和最优控制算法(MPC+WBC)、模拟学习+强化学习(IL+RL)等几个阶段。

目前的主流是MPC+WBC方案,但IL+RL路线被行业普遍认为是未来主流的控制方式,但由于该方案经过创业公司们的无数次尝试后,进入到技术瓶颈期,且在短期内难以突破,这也是诸多人形机器人本体公司推出轮式仿生机器人而不是双足人形机器人的主要原因。

硬件方面则主要包括芯片、传感器、执行运动控制操作的“手”“脚”等。

目前算力芯片在人形机器人身上的成本占比大概是几十分之一,地平线分拆出来的芯片及解决方案厂商地瓜机器人开发者生态负责人胡春旭在接受媒体采访时表示,在不同类型的机器人中,芯片成本占比差别不大,大约在7%~10%之间,一台人形机器人均价50万的情况下,芯片这一层的成本不超过1万元。不过,未来在人形机器人电机等部件成本下行的情况下,芯片部分成本占比预计有所增加。

相比之下,运动控制与执行部分的“手”就要贵很多。

由于手需要执行抓取、放置、推拉等动作,对操作精度的要求也很高,上肢操作的自由度自然就相应增加了。

有专业人士表示,人形机器人不算上“手”,全身自由度可能在27个左右,然而去年11月底,特斯拉展示的Optimus人形机器人能用手接住网球并放下,动作灵活,其采用的灵巧手自由度比前一代增加了11个,达到22个。

在行业对高自由度形成共识的大背景下,做灵巧的手相当于再造一个机器人,这也是“手”的价格居高不下的原因之一。

星动纪元联合创始人席悦曾介绍过自家产品,“手占人形机器人全身成本大概1/5到1/4”,其中的主要原因在于现在的触觉传感器还很贵,甚至比整只不带触觉传感器的“手”更贵,“一只手用到的触觉传感器可能要大几千元,一只手上的触觉传感器只有在占手的成本10%左右的时候才可能大规模应用”,有专业人士如是表示。

从上文的分析中不难看出,就像无人车一样,从最开始的几十、上百万一辆,到逐渐下降到20万左右的Robotaxi,甚至10万以下的无人配送车,自动驾驶的普及与渗透这才加快了速度。

对于具身智能创业企业们来说,如何将机器人的价格打下来,将是他们在未来竞争中能够占据主动的关键。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/68048.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MFC常用操作

1,获取STATIC控件的值 CString str; m_STATIC2.GetWindowText(str);//获取STATIC控件的值 MessageBox(str); 2.设置EDIT控件的值 m_EDIT2.SetWindowText(str); GetDlgItem(IDC_EDIT1)->SetWindowText("Leave"); 3.移动控件 m_EDIT2.SetWindowPos(…

Flutter_学习记录_基本组件的使用记录

1.TextWidge的常用属性 1.1TextAlign: 文本对齐属性 常用的样式有: TextAlign.center 居中TextAlign.left 左对齐TextAlign.right 有对齐 使用案例: body: Center(child: Text(开启 TextWidget 的旅程吧,珠珠, 开启 TextWidget 的旅程吧&a…

什么是COLLATE排序规则?

在当今数字化世界中,数据的整理、比较和排序是至关重要的。在数据库管理和编程语言中,我们经常需要对字符串进行排序,以展示或处理信息。为了实现这一点,各种系统和工具提供了排序规则,其中COLLATE排序规则就是其中的一…

打印输入单词字符数量统计直方图-C语言第二版

1. 编程要求 多年前写过一篇用 C 语言实现打印单词字符数量统计的直方图的文章, 现在看上去有些混乱, 对一些任务划分不清晰, 全部混在一起. 于是重写了这个编程题, 希望可以给初学者一些参考, 并且我分别用 C, C, Java, Python 四种语言完成了这道编程题, 有兴趣的可以看我另…

【QT】-explicit关键字

explicit explicit 是一个 C 关键字,用于修饰构造函数。它的作用是防止构造函数进行隐式转换。 为什么需要 explicit? 在没有 explicit 的情况下,构造函数可以用于隐式类型转换。这意味着,如果你有一个接受某种类型的参数的构造…

【C++模板】:如何判断自定义类型是否实现某个函数

一、引子 偶尔我们会面对这样的尴尬的场景,我们需要显示的去判断在某个自定义类型中,是否已经提供了我们期待的API接口,以避免产生“莫须有”的错误。阁下该如何破解此问题! 这里,直接给出一种通用的方法,…

认识Django项目模版文件——Django学习日志(二)

1.默认文件介绍 └── djangoproject1/├── djangoproject1/│ ├── urls.py [URL和函数的对应关系]【常用文件】│ ├── settings.py [项目配置文件]【常用文件】│ ├── _init_.py│ ├── wsgi.py [接受网络请求] 【不要动】│ └──…

【JS逆向】前端加密对抗基础

目录 逆向基础断掉调试基本常见的加解密方式 encrypt-labs靶场搭建过程靶场基本教程AES加密key前端体现(固定key)AES服务端获取keyRSA非对称加密DES加密存在规律key明文加签sign加签key在服务端signAESRAS组合 逆向基础 断掉调试 通过浏览器站点控制台(F12),进行断…

C# 多线程同步(Mutex | Semaphore)

Mutex: 用于保护临界区,确保同一时间只有一个线程能够访问共享资源; Semaphore: 允许同时有多个线程访问共享资源,但会限制并发访问的数量。 Mutex运行输出 Semaphore运行输出 namespace SyncThreadDemo {internal class Program{static stri…

复位信号的同步与释放(同步复位、异步复位、异步复位同步释放)

文章目录 背景前言一、复位信号的同步与释放1.1 同步复位1.1.1 综述1.1.2 优缺点 1.2 recovery time和removal time1.3 异步复位1.3.1 综述1.3.2 优缺点 1.4 同步复位 与 异步复位1.5 异步复位、同步释放1.5.1 总述1.5.2 机理1.5.3 复位网络 二、思考与补充2.1 复…

git远程仓库如何修改

1.需要做的事情:把git的远程仓库修改掉,在git创建一个自己的仓库 如果你是私有化的话,可以生成一个自己token令牌也可以。到时候push的时候会让你登录你就可以输入你的token令牌和用户名。 2.查看当前仓库的远程地址是不是自己的 &#xff…

mysql 学习3 SQL语句--整体概述。SQL通用语法;DDL创建数据库,查看数据库,删除数据库,使用数据库;

SQL通用语法 SQL语句分类 DDL data definition language : 用来创建数据库,创建表,创建表中的字段,创建索引。因此成为 数据定义语言 DML data manipulation language 有了数据库和表以及字段后,那么我们就需要给这个表中 添加数…

【xcode 16.2】升级xcode后mac端flutter版的sentry报错

sentry_flutter 7.11.0 报错 3 errors in SentryCrashMonitor_CPPException with the errors No type named terminate_handler in namespace std (line 60) and No member named set_terminate in namespace std 替换sentry_flutter版本为: 8.3.0 从而保证oc的…

【回忆迷宫——处理方法+DFS】

题目 代码 #include <bits/stdc.h> using namespace std; const int N 250; int g[N][N]; bool vis[N][N]; int dx[4] {0, 0, -1, 1}; int dy[4] {-1, 1, 0, 0}; int nx 999, ny 999, mx, my; int x 101, y 101; //0墙 (1空地 2远方) bool jud(int x, int y) {if…

wireshark工具简介

目录 1 wireshark介绍 2 wireshark抓包流程 2.1 选择网卡 2.2 停止抓包 2.3 保存数据 3 wireshark过滤器设置 3.1 显示过滤器的设置 3.2 抓包过滤器 4 wireshark的封包列表与封包详情 4.1 封包列表 4.2 封包详情 参考文献 1 wireshark介绍 wireshark是非常流行的网络…

⽤vector数组实现树的存储(孩⼦表示法)c++

在我们遇到的算法题中&#xff0c; ⼀般给出的树结构都是有编号的&#xff0c;这样会简化我们之后存储树的操作 &#xff0c;⼀般提供两个信息&#xff1b; 结点的个数 n;n-1条x结点与y结点相连的边 题⽬描述: ⼀共9个结点셈 1号结点为根节点&#xff0c;接下来8⾏&#xff…

C语言-内存管理

1、malloc()函数 用于动态分配一块指定大小的内存&#xff0c;并返回指向这块内存的指针。如果分配失败&#xff0c; 返回 NULL。 int* ptr (int*)malloc(sizeof(int) * 10); // 分配一个包含 10 个整数的内存 if (ptr NULL) {printf("Memory allocation failed!\n&q…

蓝桥杯lesson3---string的使用

&#x1f308;个人主页&#xff1a;羽晨同学 &#x1f4ab;个人格言:“成为自己未来的主人~” string的概念 string字符串是一种更加高级的封装&#xff0c;string字符串中包含了大量的方法&#xff0c;这些方法使得字符串的操作变得更加简单&#xff0c;string的使用&…

動態住宅IP提升網站訪問成功率

動態住宅IP通常與普通家庭用戶的網路連接相關聯。這種IP地址的特點在於&#xff0c;它是動態變化的&#xff0c;用戶在每次連接時可能會獲得不同的IP地址。這與靜態IP形成了鮮明對比&#xff0c;後者在連接期間保持不變。傳統上&#xff0c;IP地址分為住宅IP和數據中心IP兩類。…

进制之间转换

「 一、十进制 二进制 」 1.十进制转二进制&#xff1a;一直除以2直到商为0&#xff0c;再反向取余数。 例&#xff1a;13&#xff08;十进制&#xff09;转1101&#xff08;二进制&#xff09; 2.二进制转十进制:最后一位数开始是2^0&#xff0c;然后一直按照指数递增的方式…