对话鹿明团队:如何用真机数据,服务全球三分之二的具身团队?

作者 | 金旺

栏目 | 机器人新纪元

喻超是在2024年9月创业,组建了鹿明机器人团队,开始重新思考人形机器人的商业化路径。

当时国内人形机器人创业热潮已经兴起两年,鹿明并不是这波热潮中第一批创业团队,但作为这家公司的创始人,喻超与机器人,尤其是具身机器人的渊源却是由来已久。

喻超最早是在2016年清华大学毕业之际,看到了Sergey Levine的人工智能系列经典论文,Sergey Levine是加州大学伯克利分校RAIL实验室负责人,也是现在美国具身智能领域人气创业公司Physical Intelligence(Pi)的首席科学家。

Sergey Levine是第一位在论文中将神经网络用到了机器人控制上的学者,他的论文让喻超意识到,在人形机器人上,神经网络将会替代传统方法。

于是,喻超先是加入上海岭先机器人负责具身机器人算法研发,基于神经网络进行机器人模型探索,率先在国内研发了基于AI驱动的人形机器人,后又于2020年加入追觅,负责追觅具身机器人业务,主导了小米CyberDog的研发和量产,以及实现了后空翻的电驱人形机器人。

2024年,喻超看到大模型技术在NLP领域的突破后,判断Scaling Law在具身智能领域同样成立,与此同时,他也发现在行业火热背后,依然存在许多未解难题,诸如数据基础设施不够完善,无法支撑具身智能在实际场景中规模化落地。

这让他有了创业的念头。

我们能够看到的是,在鹿明成立的这一年多里,他们1秒起身的全尺寸人形机器人、双臂负载达到50kg的机器人,以及无本体数据采集软硬件系统FastUMI Pro技术,给整个行业带来了不小的冲击。

不过,鹿明团队在过往这两年里一直保持低调风格,直到最近,在鹿明举办的首场技术沟通会上,我们第一次看到了鹿明完整的技术路线、产品进度,以及鹿明创始团队对于具身智能商业化的思考。

01 具身智能的第四条数据路径

过往十几年机器人研究和从业经验,让喻超更加笃定数据的重要性,创办鹿明时,在数据获取的路径上,选择了一条当时还很小众的技术路线,UMI。

什么是UMI?

所谓UMI(Universal Manipulation Interface),指的是由斯坦福大学提出的一种通过通用操作接口进行数据采集和策略学习的框架,通过手持夹具和通用接口设计,可以便携、低成本地进行数据采集,并将这样的数据直接用到机器人策略学习和模型训练中。

相较于遥操作数据采集,这是一种不需要机器人本体的数据采集方法,解放了本就还未在市场形成规模的人形机器人,还提高了数据采集效率、降低了数据采集成本。

不过,这条路并不好走,丁琰的加入,加速了鹿明在UMI上的技术研发进程。

博士毕业于纽约州立大学计算机科学专业的丁琰,曾就职于上海AI Lab,做过多款VLA模型,加入鹿明做联席CTO,是2025年的事。

据丁琰透露,在2024年3月博士毕业后,他就一直在UMI这个方向上做研究,“应该算是国内最早做UMI的人,没有之一。”

在研究UMI这几年里,丁琰最重要的一个成果是FastUMI。

FastUMI是对于UMI的一次系统性升级,通过对数据采集和处理方法的创新,提升了数据采集的效率和质量,并面向全球构建起了千人规模的UMI社群,这为UMI从实验室走向工业界奠定了基础。

实际上,即便是到了数据驱动具身智能已经成为共识的2025年,UMI依然算不上是一条主流路径,这一年市面上共有三种主流数据获取路径,分别是以智元为代表的遥操作真机采集、以银河通用为代表的仿真数据合成,以及以它石智航为代表的人类视频数据应用。

直到2025年11月,美国Sunday家庭服务机器人Memo展示了其前沿基础模型能力,Generalist的GEN-0完成27万小时数据训练,人们才发现,这两家明星团队背后都是通过UMI这条技术路径进行的数据采集。

这时再看国内的商业化具身机器人团队,鹿明就成了UMI这条技术路线的代表。

在行业对于UMI关注度越来越高后,另一个问题开始浮出水面——如何基于UMI设备采集的数据训练出具身模型?

丁琰指出,UMI现在的市场现状是“设备很多,模型很少”,行业内几乎看不到“公开、稳定、可复现的UMI模型案例”。

之所以会如此,问题并非出在模型训练阶段,而是大量UMI数据从生成之初,就不具备进入训练管线的条件。

丁琰强调,“UMI数据并不等于画面清晰的视频,而是AI理解、对齐,并在物理世界中可复现的交互行为记录。”

即采集的视频中每一帧的视觉数据与空间位姿要严格对齐,多模态信息之间要能实现毫秒级同步,采集的视频数据轨迹在物理空间中可复现,这样的数据本质上是一种高一致性、高信息密度、可复现的时序结构数据。

如果从数据需求再回过头来看数采设备的话,当前很多UMI设备普遍存核心硬件模组能力不足、产品设计系统性不够的问题,这直接导致了采集到的数据质量不够高。

正是因为这些问题的存在,让鹿明决定在进行具身机器人研发过程中,要率先做好高质量数据生产管线。

02 百万真机数据,商业化落地门槛

作为一个存在了百年的高技术密度的行业,机器人以往研发路径是先做硬件、做完硬件做软件,之后才是算法研发和补充数据。

不过,这样的机器人研发路径在UMI这条技术路线下开始失效。

UMI是一个需要硬件、算法、数据强耦合的系统,硬件决定数据质量,数据质量决定算法性能,算法又会反向约束硬件执行与数据设计,其中任意一环不稳定,都将会导致高质量模型无法出现。

硬件、数据、算法三环,也就构成了鹿明打造的数据管线,这也正是鹿明的Fast UMI Pro数据采集系统。

数采硬件是三环中的基础,其性能高低直接决定了数据的质量,这里所指的硬件不是机器人本体,而是一套夹爪设备。

鹿明专为UMI设计了多个版本夹爪,诸如触觉便携、平动便携、平动全功能、非平动全功能版本夹爪,其中,负载更高的非平动版本夹爪主要用于工业领域,平动版本则多用于科研、教育场景。

与此同时,鹿明还研发了用于机械臂的机载相机,用户在使用机械臂进行数据采集时,无需更换夹爪,只需要将机载相机装到机械臂上就可以进行UMI数据采集。

我们在沟通会上看到了这款设备的两个关键参数,一个是空间定位精度达到了1mm,另一个是数据采集频率达到了60Hz。

据丁琰透露,“在这一系列产品中,鹿明特别定制了超高性能传感器架构,来为这一系列夹爪带来了很好的持续高一致性。”

例如高性能运动级鱼眼镜头,能够保障使用者在高速运动下采集时,画面不糊、不失真,而且还具备动态恢复能力,把手挡住镜头,再松开,普通镜头可能要3-4 秒才能恢复,鹿明的FastUMI Pro可以瞬间恢复。

丁琰告诉我们,“对不做算法的人来说,这是小细节,但对做模型的人来说,这决定了任务是 0,还是 100,中间没有差不多”。

至于跨本体的物理泛化,其实只要在不同的机械臂上放一模一样的相机,末端执行器也保持相同,数据就可以互用。

由此实现的机器人本体泛化,我更愿意称之为基于物理层面的本体泛化。

就数据层面来看,鹿明制定了一套工业级数据质量评估体系,在评估体系中共有8道工序,前三道工序分别是:

第一,通过软件生成精心设计的动作,鹿明团队认为,只有按机器人可理解的逻辑设计的动作,才对机器人有“教学意义”;

第二,数据完整性筛选,过滤掉因漏采或传感器失效导致的不完整数据;

第三,物理合理性筛查,过滤掉不符合物理世界规律的数据。

其余5道工序则是由鹿明团队独创,鹿明团队并未对外公布。

丁琰指出,“前三道工序是大部分机器人团队都能做到的,可以筛掉约10%的不合格数据,通过后5道独创的工序,鹿明团队可以进一步筛掉约20%的不合格数据。”

值得注意的是,在具身智能被写入政府工作报告、成为国家战略新兴产业后,具身智能的数据标准问题也被提上了日程,2025年,上海就曾发布人形机器人数据集标准,国家数据局近日也指出,2026年,我国将面向智能体、具身智能等方向推出30余项数据国家标准。

丁琰在接受媒体采访时告诉我们,“我们团队已经陆续收到来自不同类型客户的标准,在给客户交付的时候,我们的数据质量不仅完全符合这些标准,甚至远超客户要求。”

基于这样的设备和标准,鹿明在2025年通过自建数采工站,已经完成了10万小时数据的采集,据鹿明联合创始人赵广智透露,接下来,鹿明数据采集会分两步走:

第一步,2026年以与政府/产业方合作建设数采工厂方式,实现100万小时数据产能;

第二步,2027年,以众包激励形式,实现1000万小时的数据产能。

这里值得一提的是,无论是对于鹿明、对于UMI,还是具身智能整个行业,百万小时高质量数据都将会是一个关键节点。

喻超告诉我们,“在2026年完成百万小时高质量数据产能建设后,将带动硬件本体在场景中规模化落地,同时在场景中进一步加强我们的硬件能力,进一步提升硬件本体落地规模。”

实际上,鹿明的商业化探索也已经开启。

03 先为具身智能,提供基础设施

2025年7月,三菱电机与鹿明官宣合作,基于这次合作,双方将共研工业级人形机器人核心技术,制定智能工厂机器人应用技术路线图,更重要的是,鹿明的人形机器人由此也进入到了三菱的工厂。

喻超告诉我们,“鹿明和三菱的第一期合作已经完成,已经在三菱工厂中的PLC产线上换用了轮式双臂人形机器人,并在不到两个月的时间里,将单个工序的节拍从30秒压缩到12秒左右。”

不过,喻超也指出,“要想大规模可靠完整落地,还需要在这一场景中将数据量级进一步提上来,所以接下来我们的合作会进入三菱更多实际场景中,来实现数据规模化。”

在喻超的规划中,鹿明的商业化分为三个阶段:

第一阶段,作为数据和硬件的基础设施供应商,服务具身智能的算法公司、硬件公司,场景和产业应用方;

第二阶段,与场景方合作,推动人形机器人在具体场景中落地;

第三阶段,与生态合作伙伴,共同推动人形机器人通用本体(含数据、模型)的大规模落地。

关于这三个阶段的时间预期,喻超告诉我们,“预计第一阶段预计需要三年左右(2025年开始),第二阶段需要五年左右(2026年开始),第三阶段则是整个行业和生态未来共同努力去实现的一个目标。”

现在来看,鹿明目前要做的是为整个行业提供数据、硬件基础设施,让FastUMI Pro数据采集系统朝着具身智能的‘USB接口’方向演进,据悉,这套系统将真机数据采集效率提升了5倍、成本降低了80%。

而据喻超透露,“目前全球三分之二的具身智能团队都在使用FastUMI Pro,2026年鹿明预期营收规模在亿元级别。”


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1193873.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI如何优化AppImage打包流程?

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个AI辅助工具,用于自动生成和优化AppImage文件。工具应能分析项目依赖,自动打包应用,并优化文件大小。支持多种Linux发行版,提…

2026年本地效率高的压缩空气检测机构推荐排名

在工业生产与品质管控愈发严格的当下,压缩空气作为众多行业的关键辅助资源,其洁净度直接关系到产品质量、生产安全与合规要求。面对市场上良莠不齐的压缩空气检测服务,如何找到口碑可靠、诚信度高且本地效率突出的机…

华体育登录系统实战:高并发场景下的架构设计

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 构建一个模拟高并发体育平台登录系统的演示项目。要求:1. 实现分布式登录架构 2. 包含负载均衡演示 3. 压力测试模块(模拟10万并发)4. 故障自动…

verl生产环境部署经验,稳定性超预期

verl生产环境部署经验,稳定性超预期 1. 引言:为什么选择verl进行生产级RL训练 在当前大模型后训练(post-training)任务日益复杂的背景下,强化学习(Reinforcement Learning, RL)已成为提升语言…

AI一键生成ENSP配置命令,告别手动输入烦恼

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个ENSP配置命令生成器,用户输入自然语言描述的网络需求(如配置VLAN 10,端口1-5属于该VLAN),系统自动转换为标准的…

麦橘超然提示词无效?Gradio界面输入处理问题解决方案

麦橘超然提示词无效?Gradio界面输入处理问题解决方案 1. 问题背景:为什么你的提示词没效果? 你是不是也遇到过这种情况:在使用“麦橘超然”图像生成控制台时,明明输入了详细的描述词,比如“阳光下的樱花少…

AutoGLM-Phone如何评估执行成功率?指标监控部署指南

AutoGLM-Phone如何评估执行成功率?指标监控部署指南 Open-AutoGLM 是智谱开源的一款面向手机端的 AI Agent 框架,旨在通过多模态理解与自动化操作能力,让大模型真正“动手”完成用户指令。其核心项目 AutoGLM-Phone 和基于它构建的 Phone Ag…

2026年中国短视频制作公司推荐:基于数据闭环与合规场景全面评价

摘要 在数字营销浪潮中,短视频已成为品牌构建认知、驱动增长不可或缺的核心渠道。然而,面对瞬息万变的平台算法、日益挑剔的用户审美以及复杂的投放逻辑,企业决策者普遍陷入选择困境:是自建团队承担高昂的试错成本…

2025烟台半马

2025烟台半马9/4 7km 7:19 9/10 9km 7:16 9/18 10km 7:15 9/23 12km 7:06 9/26 14km 6:58 9/30 16km 7:27 10/3 16km 7:25 10/7 16km 7:23 10/11 18km 7:17 10/15 6km 6:51 10/19 21km 6:51 一个半月。从7km到半马 7公…

5分钟搭建百度参数DC=Y114PC=解析器原型

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 在快马平台上快速创建一个百度搜索参数解析器原型。输入任意包含DCY114&PC的URL,自动提取并高亮显示参数部分,提供简单的解释说明。要求界面简洁&#…

企业级应用首选!YOLOv13镜像助力产线缺陷检测

企业级应用首选!YOLOv13镜像助力产线缺陷检测 在现代智能制造的质检环节中,每一块PCB板、每一个金属零件、每一瓶药品包装都必须经过毫秒级的视觉筛查。传统人工检测不仅效率低、成本高,还容易因疲劳导致漏检。而AI驱动的自动化缺陷检测系统…

浏览器文件格式转换工具:简单、安全、高效的文本与数据处理助手

在数字化办公与日常工作中,我们经常需要处理不同格式的文件。无论是整理文本内容、导出数据表格,还是进行简单的格式转换,找到一个便捷、安全、高效的工具尤为重要。今天,我们为您介绍一款完全在浏览器中运行的文件格式转换工具&a…

Python + LLM 搞钱实战:全自动“网络问答接单”流水线,一周跑出第一笔收入

标签: #Python #LLM #SideHustle #Automation #RPA #PassiveIncome 📉 前言:为什么这能搞钱? 传统的“网络答主”每天只能写 3-5 个高质量回答,耗时耗力。 而 AI 的出现,将生产成本降低到了几乎为零。 搞钱公式: 我们要做的,就是用 Python 把“流量”这一项拉满。 …

AI 加速开源贡献:自动匹配 Issue,一键生成高质量 PR(含测试与文档)

标签: #OpenSource #GitHub #AI #LangChain #Automation #DevTools 📉 前言:开源贡献的“三座大山” Issue 迷海:GitHub 上有数百万个 Issue,哪一个适合我?(既不能太难,又不能太无聊)。 上下文缺失:拿到一个 Bug,要在几万行代码里找到是哪一行逻辑错了,这通常需要…

中小企业预算有限?Live Avatar云服务按需租用方案

中小企业预算有限?Live Avatar云服务按需租用方案 1. Live Avatar:开源数字人技术的新选择 你有没有想过,一家只有几个人的小公司,也能拥有自己的“虚拟主播”?不是那种僵硬的动画形象,而是能说话、会表情…

本地部署AI在医疗影像分析中的实际应用案例

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个医疗影像分析系统,要求:1. 支持DICOM格式影像的本地AI分析;2. 实现肺部CT图像的结节检测功能;3. 提供可视化分析报告生成&a…

FSMN VAD输出目录设置:结果文件存储位置调整

FSMN VAD输出目录设置:结果文件存储位置调整 1. 引言 你是否在使用FSMN VAD语音活动检测系统时,发现处理结果默认保存在某个固定路径,而你想把它们集中管理到自己的项目目录?或者你在做批量音频分析时,希望每个任务的…

Qwen-Image-Edit-2511真实测评:几何推理能力大幅提升

Qwen-Image-Edit-2511真实测评:几何推理能力大幅提升 在图像编辑类AI模型快速迭代的当下,Qwen-Image-Edit系列凭借其对细节控制和语义理解的持续优化,逐渐成为工业设计、建筑可视化与创意修图领域的重要工具。最新发布的Qwen-Image-Edit-251…

GPT-OSS-20B广告创意:文案生成系统实战部署

GPT-OSS-20B广告创意:文案生成系统实战部署 1. 让AI帮你写广告文案:GPT-OSS-20B实战价值 你有没有遇到过这样的情况:产品明明不错,但就是不知道怎么把卖点说清楚?写个朋友圈文案都要憋半小时,电商详情页更…

智能内容访问技术实战指南

智能内容访问技术实战指南 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 在数字信息时代,内容付费墙已成为获取优质信息的常见障碍。本文为您提供一套完整的智能内容访问…