国内首次开源灵巧操作数据集!填补具身智能数据空白!

如果你觉得现在的机器人已经很聪明,那你大概率还没见过它们“拿纸杯”、“拆纸箱”时手忙脚乱的样子。在仿真环境里,机器人抓什么都稳;可一到真实世界,纸杯一捏就扁、快递一夹就滑,仿佛一夜回到解放前。

问题出在哪?一句话:它们只会“看”,不会“摸”。

而现在,这块短板终于有人补上了。

近日,乐聚机器人正式开源了国内首个面向真实作业场景的人形机器人灵巧操作真机数据集 —— LET 数据集,首批 800 条高质量多模态操作数据已经上线乐聚 OpenLET 社区,向行业开发者、科研团队全面开放。

这不是普通意义上的“再来一个数据集”,而是一次具身智能数据体系的范式升级。

为什么「灵巧操作数据」是具身智能的最后一公里?

过去几年,具身智能属实爆火!同时也呈现出一种表面繁荣与实际落地脱节的矛盾:在大模型驱动下,感知和决策能力显著提升,但物理世界的稳定执行仍面临严峻挑战,导致“动作虚浮”。这一现象源于技术、生态与现实的多重约束。

你可以看到一堆工作在做三维感知、世界建模、语言导航,但一旦涉及真实操作,场面就变成了:

  • 看得懂物体✅

  • 说得出任务✅

  • 一上手就翻车❌

本质上有一个很重要的原因:我们极度缺少真实世界的“触觉 + 力觉 + 连续控制”数据。

传统机器人数据集大多停留在三个维度:

维度

传统数据集

视觉

RGB / RGB-D

动作

离散关键帧

触觉

基本为零

这就像让一个人只靠“看视频”学做精细装配,不让他亲手摸螺丝。

结果可想而知:模型上限被数据直接“封死”。

只要这一公里打不通:

  • 家庭机器人只会是“花钱买了个电子爹回家”

  • 人形机器人只会是展会/晚会吉祥物

国内首个:高质量灵巧操作 LET 数据集正式开源

这一次,乐聚机器人直接从源头动刀:从真机采集真实操作全过程数据。

灵巧操作 LET 数据集是什么?

填补高质量灵巧操作数据空白!这是国内首次开源、面向真实作业场景的人形机器人灵巧操作数据集,首批共 800 条真机高质量灵巧操作数据,覆盖:家庭、物流、日化三大核心场景,打通“视觉-力触-动作”全链路闭环。

所有数据来自乐聚新一代灵巧手的统一采集系统,有效避免了多设备差异导致的数据偏差问题。

图. 灵巧手指尖触觉&腕部六维力矩

数据维度更丰富,覆盖全链路需求

这套数据不是“视觉+动作”的老套路,而是一次真正意义上的全链路闭环。重点新增了触觉数据、六维力数据。如下表所示,包含五大核心数据维度:

数据类型

内容

触觉阵列数据

6 × 12 × 5 指尖触觉传感器采集的时序压力数据

六维力数据

三维力和力矩信息,精度达 ±0.5%

RGB-D 视觉数据

高分辨率彩色图 + 稠密深度图

同步动作信息

手部关节角度、速度等数据

多场景标注

场景类型、物体材质、操作目标等语义标签

这意味着什么?

意味着每一次“抓、捏、放、推”等动作,都被完整记录为:视觉 + 力觉 + 触觉 + 控制信号 + 语义标签的五元组。

更精细的数据质量源于硬核技术支撑

乐聚新一代灵巧手的性能已经是“工业级配置”:160–185°/s 关节速度、0.35 秒开合响应、±0.2mm 定位精度,同时搭配指尖触觉感知和实时力觉反馈(腕部六维力矩)系统,可以完整记录真实场景中的精细化操作全过程。

图. 数采系统画面

图. 家庭场景稳定抓取水果

图. 快消场景无损抓放物料

图. 快递场景高效分拣

数据驱动模型性能提升,实现从「看得见」到「操作得准」的跨越

在纸箱拆垛场景中,机器人需要:感知包裹形变、动态调节力度、实时修正姿态,而这些靠视觉?远远不够。LET 数据集的触觉阵列和六维力矩数据,让模型真正拥有了:感知物理世界状态变化的能力。

LET 数据集推动机器人从「看得见」到「操作得准」跨越:

  • 任务成功率大幅提升:机器人能实时感知判断物体形状与受力状态,动态调整抓取姿态和力度

  • 环境感知更全面:打破纯视觉局限,构建稳定的物理交互闭环

  • 研发落地门槛降低:配套的数据工具包和示例代码,覆盖从“算法研究”到“产业验证”的全链路需求

  • 模型泛化能力增强:真实数据,助力突破“仿真到现实(Sim-to-Real)”鸿沟

图. 纸箱拆垛

LET 数据集下载方式

方式一:扫码获取

方式二:官方申请

可通过官方邮箱 wangsong@lejurobot.com 直接申请获取

乐聚 OpenLET 社区:乐聚机器人 × 开放原子开源基金会

很多数据集的结局只有一个:发完论文就躺平。

而这一次,乐聚机器人选择了一条完全不同的路:打造乐聚 OpenLET 开源社区。

乐聚 OpenLET 社区定位非常清晰:

  • 以“ LET 人形机器人真机数据集”为核心资产

  • 聚焦人形机器人真实数据

  • 连接全球开发者、各大高校、科研机构、创业公司

  • 在开放原子开源基金会平台上构建合规、可持续的开源生态

这解决了国内长期存在的一个隐性痛点——“孤岛式数据集”的死亡陷阱:

  • 有数据,但没人维护

  • 有论文,但无产业复用

乐聚 OpenLET 社区的出现,本质是在给中国具身智能搭一条“可持续发展的主干道”。

总结与展望

过去我们总在谈:VLA、世界模型、大模型等前沿技术,但真正决定机器人是否能走出实验室的,还有一个关键:它到底摸不摸得准?

LET 数据集的开源,是一次罕见的、真正从工程源头解决问题的行动。它不炫技,不空谈未来,只做一件事:让机器人第一次拥有可信赖的“触感记忆”。这不仅展现了乐聚在人形机器人领域的技术硬实力,更向行业输出了标准化数据建设的实践经验。

据了解,乐聚机器人后续还将开放工业场景的灵巧操作数据,为了方便第一时间了解和下载高质量开源数据,强烈推荐大家持续关注乐聚 OpenLET 社区!

LET 数据集和乐聚 OpenLET 社区,或许是中国机器人走向实用化的关键拐点。

Amusi 期待更多厂商积极投身机器人的开源生态建设,从算法到数据、从基准到应用,形成合力,共同推动整个行业的突破。让人形机器人不再是实验室里的“高冷科技”,而是走进每一个普通家庭的“好伙伴”!

整理不易,请点赞和在看

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1132120.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是proxy

在前端开发中,Proxy 是 ES6 引入的一个高级特性,用于拦截和自定义对象的基本操作(如属性访问、赋值、枚举、函数调用等)。它为开发者提供了元编程能力,是实现响应式系统、数据校验、访问控制等功能的核心技术。 一、基…

收藏这篇就够了!DeepSeek+RAG本地知识库搭建实战,小白也能上手的大模型教程

DeepSeekRAG本地知识库技术结合了DeepSeek大模型与检索增强生成(RAG)技术,旨在构建高效智能的本地化知识库系统。DeepSeek具备强大自然语言处理能力,能理解和生成文本;RAG技术通过结合信息检索和文本生成,使模型在生成文本时可参考…

AI Agent短期记忆完全指南:4种处理长对话问题的方法+代码详解

文章详细介绍了AI Agent的短期记忆机制,分析了长对话引发的上下文丢失、响应变慢等问题,提供了4种解决方案:修剪消息、删除消息、总结消息和自定义策略。通过代码示例展示了如何实现Agent短期记忆,包括基础用法、自定义状态、消息…

Web足球青训俱乐部管理后台系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】

💡实话实说:用最专业的技术、最实惠的价格、最真诚的态度服务大家。无论最终合作与否,咱们都是朋友,能帮的地方我绝不含糊。买卖不成仁义在,这就是我的做人原则。摘要 随着足球运动的普及和青训体系的不断完善&#xf…

解耦梯度学习解决多模态模型欠优化问题,性能提升超3%

本文揭示了多模态学习中欠优化问题的根本原因在于模态编码器与融合模块间的优化冲突,导致主导模态性能下降。为解决此问题,作者提出解耦梯度学习(DGL)框架,通过截断多模态损失反向传播到编码器的梯度,并引入单模态损失独立优化编码…

2026AI产品经理与大模型学习路线图:从小白到专家的进阶指南

本文详细介绍了AI产品经理的三阶段学习路线(基础知识、专业技能、软技能)及实践经验积累方法,并提供了大模型学习资源,包括路线图、视频教程、技术文档、面试题等,帮助学习者系统掌握AI产品经理与大模型知识&#xff0…

大模型+知识图谱构建制药业“第二大脑“:从零开始实现企业级知识管理

本文探讨如何利用大语言模型和知识图谱技术构建制药企业级"第二大脑",整合分散的科研数据与文献为可搜索知识库。通过RAG和Graph-RAG技术实现60%文档审查效率提升,为制药行业创造600-1100亿美元年度价值。文章详解技术架构、实际应用案例、实施…

深入了解移动开发领域 CI_CD 的工作原理

深入了解移动开发领域 CI/CD 的工作原理 关键词:移动开发、CI/CD、持续集成、持续交付、工作原理 摘要:本文旨在深入剖析移动开发领域 CI/CD 的工作原理。首先介绍了 CI/CD 在移动开发中的背景,包括目的、适用读者等信息。接着阐述了 CI/CD 的核心概念与联系,以清晰的文本示…

Claude Code完美平替OpenCode:小白也能轻松上手的AI编程神器

OpenCode是Claude Code的开源平替工具,提供图形化界面,支持多种AI模型(包括免费GLM-4.7和MiniMax M2.1)。最大亮点是支持多Session并行运行多个Agent,实现协作编程,相比命令行的Claude Code更友好。支持CLI…

打造AI时代智能知识库:Obsidian+Dify向量检索全攻略(附插件下载)

本文详细介绍了如何将Obsidian与Dify知识库相结合,打造基于向量存储的AI友好知识系统。作者开发了自定义同步插件,解决了Obsidian原生搜索对AI不友好的问题,实现了语义检索功能。文章涵盖Dify知识库创建、Embedding模型配置、API密钥获取&…

可视化图解算法77:零钱兑换(兑换零钱)

1.题目 描述 给定数组 coins ,coins中所有的值都为正整数且不重复。每个值代表一种面值的货币,每种面值的货币可以使用任意张,再给定一个amount,代表要找的钱数,求组成amount的最少货币数。 如果无解,请…

【毕业设计】SpringBoot+Vue+MySQL ONLY在线商城系统平台源码+数据库+论文+部署文档

💡实话实说:用最专业的技术、最实惠的价格、最真诚的态度服务大家。无论最终合作与否,咱们都是朋友,能帮的地方我绝不含糊。买卖不成仁义在,这就是我的做人原则。摘要 随着互联网技术的快速发展和电子商务的普及&#…

零代码搭建大模型知识库,5分钟搞定RAG应用,小白也能轻松上手

本文详细介绍如何使用Dify平台零代码搭建大模型知识库,无需编程经验即可实现RAG应用。通过创建Chatflow应用、配置大模型节点、设置知识检索节点和回答问题节点,读者可快速构建一个可用的大模型知识库,深入了解RAG工作流程,提升工…

前后端分离墙绘产品展示交易平台系统|SpringBoot+Vue+MyBatis+MySQL完整源码+部署教程

💡实话实说:用最专业的技术、最实惠的价格、最真诚的态度服务大家。无论最终合作与否,咱们都是朋友,能帮的地方我绝不含糊。买卖不成仁义在,这就是我的做人原则。摘要 随着数字化时代的快速发展,艺术与科技…

从封闭到通用:RLVR到RLPR的LLM推理强化技术全解析

本文深入解析了强化学习在LLM推理进化中的应用,从依赖外部验证器的RLVR范式,演进到利用模型内在概率的RLPR新方法。重点介绍了1-shot RLVR的高数据效率和RLPR在通用领域的突破,结合verl框架详解工程实现。揭示了GRPO算法的核心作用和熵正则项…

AI Coding时代,程序员的7项核心竞争力,不看可能会被淘汰(建议收藏)

文章探讨了AI编程时代程序员的核心竞争力。尽管AI能帮助编写代码,但程序员的基本功、需求理解、编码规范、协作能力、技术深度和广度、安全生产意识等仍无可替代。在AI时代,程序员应专注于提升自身不可替代的能力,将AI作为提高效率的工具&…

企业级网上租赁系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】

💡实话实说:用最专业的技术、最实惠的价格、最真诚的态度服务大家。无论最终合作与否,咱们都是朋友,能帮的地方我绝不含糊。买卖不成仁义在,这就是我的做人原则。摘要 随着互联网技术的快速发展和共享经济的兴起&#…

从九尾狐AI企业培训案例解析智能矩阵获客的技术架构与实现路径

第一章:智能矩阵获客系统的技术底层逻辑当前企业AI获客解决方案普遍存在两大痛点:一是技术门槛高需专门团队维护,二是内容生产与分发效率低下。九尾狐AI提出的"数字人全域矩阵"架构,本质上是通过三层技术实现低成本自动…

大模型产业链四大层次解析:从算力芯片到行业应用的全面指南

本文解析了大模型产业四大层次架构及核心挑战:基础设施层算力不足,模型层技术代差,中间层标准不统一,应用层人才短缺。提出从产业、科学、工程三维度突破,构建人机协同机制与可信数据平台。核心观点认为超级智能不可避…

xampp-linux-1.8.1.tar.gz 怎么安装?Linux下XAMPP离线安装完整步骤

​一 先准备东西​ 安装包:xampp-linux-1.8.1.tar.gz下载链接:https://pan.quark.cn/s/deec067a4ccf(提前下载好,放 /tmp或 /opt目录都行)。 权限:用 root​ 或 sudo​ 操作(不然解压、启动会报…