【AlohaMini学习笔记】第二天:初见LeRobot

LeRobot:面向嵌入式AI的开源机器人控制框架

在嵌入式人工智能(Embodied AI)研究快速发展的当下,机器人控制框架的“易用性、兼容性、低成本”成为推动技术普惠化的关键。

由Hugging Face主导开发的LeRobot正是这样一款面向科研与教育场景的开源机器人控制框架——它以模块化设计为核心,打通了“硬件控制-数据采集-算法部署-模型评估”的全流程,尤其适配AlohaMini等低成本开源机器人平台,让研究者与开发者无需重复造轮子,即可快速落地嵌入式AI算法。

核心定位

LeRobot诞生的核心目标,是解决传统机器人控制框架“门槛高、兼容性差、与AI生态割裂”的痛点:

  • 低门槛接入:提供统一的机器人抽象接口,屏蔽不同硬件(电机、相机、机械臂)的底层差异,新手也能快速完成硬件连接与控制;
  • 全流程支持:覆盖“硬件校准→遥操作控制→数据录制→算法推理→评估复盘”的Embodied AI研究全链路;
  • 生态无缝整合:深度对接Hugging Face Hub,支持数据集、预训练模型的一键上传/下载,降低算法复用成本;
  • 低成本适配:专为AlohaMini、LeKiwi、SO-ARM100等低成本开源机器人优化,兼顾嵌入式硬件(树莓派、Jetson)与桌面端开发环境。

LeRobot基于Apache 2.0协议开源,核心代码托管在Hugging Face生态中,是嵌入式AI领域少有的“全栈式、平民化”控制框架。

核心架构

LeRobot的架构遵循“抽象层统一、模块解耦、可扩展”的设计原则,核心模块可拆解为以下六大部分:

1. 机器人抽象层(Robot Class):硬件无关的统一接口

这是LeRobot的核心设计——通过Robot基类定义所有机器人的通用行为(连接、校准、状态感知、动作下发),不同硬件平台只需继承该类并实现专属配置,即可快速接入框架。

以AlohaMini适配的LeKiwi类为例,其核心实现逻辑如下:

classLeKiwi(Robot):config_class=LeKiwiConfig name="lekiwi"def__init__(self,config:LeKiwiConfig):super().__init__(config)# 定义电机总线(左右臂+底座+升降轴)self.left_bus=FeetechMotorsBus(...)# 左臂、底座、升降轴电机self.right_bus=FeetechMotorsBus(...)# 右臂电机# 定义相机感知系统self.cameras=make_cameras_from_configs(config.cameras)# 定义升降轴控制self.lift=LiftAxis(...)# 统一的状态/动作特征定义@propertydef_state_ft(self)->dict[str,type]:return{"arm_left_shoulder_pan.pos":float,# 左臂关节位姿"x.vel":float,# 底座x向速度"lift_axis.height_mm":float,# 升降轴高度# ... 其他状态量}

开发者无需关注“电机通信协议、相机编码格式”等底层细节,只需通过_state_ft/_cameras_ft定义机器人的状态与感知特征,即可实现硬件行为的抽象。

2. 电机控制模块:适配低成本伺服电机

LeRobot对Feetech STS3215等主流低成本伺服电机做了深度封装,核心组件包括:

  • FeetechMotorsBus:电机总线管理,支持多总线(左右臂分离)、电机校准、力矩控制;
  • Motor类:定义电机ID、型号、归一化模式(角度/百分比),屏蔽不同电机的参数差异;
  • 校准工具链:支持半圈归位、量程录制、校准文件读写,解决低成本电机的精度问题。

针对AlohaMini的16路Feetech电机,LeRobot通过总线拆分(左总线:左臂+底座+升降轴;右总线:右臂)实现精准控制,同时提供motors.py调试工具,支持电机扫描、状态监控、ID重配置等硬件调试需求。

3. 感知与通信模块:多相机+远程控制

(1)多相机感知

通过make_cameras_from_configs接口适配多相机系统,支持720p USB相机的即插即用,同时提供图像编码/解码工具(Base64+OpenCV),满足嵌入式场景下的图像传输需求。

(2)远程通信

基于ZMQ实现客户端-服务端(Client-Server)架构,LeKiwiClient类封装了指令下发(PUSH)与观测数据接收(PULL)逻辑,支持跨网络的远程控制:

classLeKiwiClient(Robot):defconnect(self)->None:# 建立ZMQ通信套接字self.zmq_cmd_socket=self.zmq_context.socket(zmq.PUSH)self.zmq_observation_socket=self.zmq_context.socket(zmq.PULL)# 连接硬件端(AlohaMini)self.zmq_cmd_socket.connect(f"tcp://{self.remote_ip}:{self.port_zmq_cmd}")defget_observation(self)->dict[str,Any]:# 拉取硬件端状态(关节位姿、相机图像、升降轴高度)latest_message=self._poll_and_get_latest_message()observation=self._parse_observation_json(latest_message)# 解码Base64图像frame=self._decode_image_from_b64(observation["camera_top"])return{**observation,"camera_top":frame}

这一设计让开发者可在桌面端编写控制逻辑,远程操控嵌入式硬件(树莓派)上的AlohaMini机器人。

4. 遥操作模块:多模态控制接口

LeRobot提供统一的遥操作接口,支持多种控制方式的灵活组合:

  • 键盘控制KeyboardTeleop类封装W/S/A/D(移动)、U/J(升降)等按键映射,适配全向移动底座;
  • Leader-Follower机械臂BiSO100Leader类支持SO-ARM100主机械臂的位姿采集,实时转发到AlohaMini从机械臂;
  • 语音控制:集成SpeechEngineGummy语音引擎,支持自然语言指令(如“上升10厘米”“前进2秒”)解析为机器人动作。

5. 数据处理模块:LeRobotDataset

针对Embodied AI研究的“数据驱动”特性,LeRobot设计了LeRobotDataset类,实现:

  • 多模态数据录制:同步记录机器人状态、相机图像、动作指令;
  • 数据集标准化:自动对齐帧率、归一化特征,生成兼容Hugging Face Hub的数据集格式;
  • 一键推送/拉取:通过dataset.push_to_hub()将数据上传至HF Hub,方便算法复用与分享。

6. 算法推理模块:预训练模型无缝部署

LeRobot内置对ACT等主流Embodied AI预训练模型的支持,通过make_pre_post_processors实现模型输入/输出的标准化处理,开发者只需指定HF Hub上的模型ID,即可快速部署推理:

# 加载预训练ACT模型policy=ACTPolicy.from_pretrained(args.hf_model_id)# 构建预处理/后处理流程preprocessor,postprocessor=make_pre_post_processors(policy_cfg=policy,pretrained_path=args.hf_model_id,dataset_stats=dataset.meta.stats,)# 推理循环record_loop(robot=robot,policy=policy,preprocessor=preprocessor,postprocessor=postprocessor,...)

LeRobot与AlohaMini的深度适配

AlohaMini作为面向教育与科研的低成本双臂移动机器人,是LeRobot生态的核心落地载体。两者的适配体现在三个维度:

1. 硬件层定制化适配

LeRobot为AlohaMini定制了LeKiwi/LeKiwiClient类,精准匹配其硬件特性:

  • 电机映射:适配16路Feetech STS3215电机(双臂6×2 + 底座3 + 升降轴1),支持左右总线独立控制;
  • 升降轴扩展:新增lift_axis.height_mm状态量,支持电动升降轴的精准定位;
  • 多相机兼容:适配5路720p相机的感知数据采集与传输。

2. 全流程工具链支持

针对AlohaMini的使用场景,LeRobot提供了开箱即用的示例脚本:

脚本名称核心功能
teleoperate_bi.py双臂遥操作+键盘底座控制,支持Leader-Follower模式
teleoperate_bi_voice.py语音+键盘+遥操作多模态控制,支持自然语言指令解析
record_bi.py录制双臂操作数据集,同步保存图像与动作,一键推送至HF Hub
evaluate_bi.py加载预训练模型,在AlohaMini上完成算法推理与评估
motors.py电机扫描、状态监控、ID配置,解决硬件调试痛点

3. 嵌入式部署优化

LeRobot针对AlohaMini的树莓派5硬件做了轻量化优化:

  • 通信层:ZMQ协议的CONFLATE模式,保证低带宽下的指令/数据优先级;
  • 计算层:支持相机图像的轻量化编码(Base64+JPEG),降低嵌入式端算力消耗;
  • 兼容性:兼容Python 3.8+,适配树莓派Ubuntu/Debian系统。

核心使用场景

1. 高校机器人课程教学

依托LeRobot的低门槛特性,学生可快速完成:

  • 硬件组装与校准:通过motors.py调试电机,完成机器人校准;
  • 基础控制编程:基于键盘/遥操作接口编写控制逻辑;
  • 数据采集与分析:录制操作数据,理解“数据驱动机器人”的核心逻辑。

2. Embodied AI算法研究

研究者可基于LeRobot实现:

  • 快速验证算法:在AlohaMini上部署ACT、BC等预训练模型,验证抓取、导航算法;
  • 标准化数据采集:生成兼容HF Hub的数据集,提升研究可复现性;
  • 多模态控制探索:结合语音、视觉、触觉等多模态感知,开发新型控制策略。

3. 创客与开源社区创新

LeRobot的模块化设计支持个性化扩展:

  • 自定义传感器:扩展雷达、触觉传感器等外设接口;
  • 自定义控制逻辑:基于Robot基类开发专属机器人适配层;
  • 跨硬件迁移:将AlohaMini的控制逻辑快速迁移至其他机器人平台。

开源生态与未来

LeRobot的开源生态具备两大核心优势:

  1. 社区协作:基于Aloha、LeKiwi、SO-ARM100等开源项目的技术积累,致谢Hugging Face、UIUC SIGRobotics等社区贡献;
  2. 生态整合:与Hugging Face的Transformers、Datasets库无缝衔接,打通“数据-模型-硬件”的闭环;
  3. 多平台兼容:支持x86桌面端、树莓派、Jetson等硬件,兼顾开发与部署场景。

未来,LeRobot将持续聚焦“降低Embodied AI研究门槛”,计划新增更多机器人硬件适配(如四足机器人、机械爪)、强化仿真环境支持(Gazebo/Isaac Gym)、完善可视化工具链,进一步推动嵌入式AI技术的普惠化。

总结

LeRobot不仅是一款机器人控制框架,更是Embodied AI研究的“基础设施”——它以模块化设计屏蔽硬件差异,以全流程工具链降低研究门槛,以生态整合打通算法落地链路。

结合AlohaMini等低成本硬件,LeRobot让“人人都能做嵌入式AI研究”成为可能:无论是高校学生的入门实践,还是科研人员的算法验证,亦或是创客的创新探索,都能在这一框架下快速落地想法,无需被底层硬件控制的细节束缚。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1131322.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

综合项目实战--电子商城项目

一、摘要本研究设计并实现了一款基于 Linux 平台的轻量级商品展示与查询 Web 系统。系统采用 C 语言开发,通过 Socket 网络编程构建 Web 服务器,集成 SQLite 嵌入式数据库实现数据存储与查询,核心功能涵盖用户登录验证、商品列表展示、关键字…

更高效更智能,华为MatePad 11.5 S解锁高效学习体验

华为鸿蒙系统官网入口 "华为MatePad11.5S搭载超清护眼柔光屏,书写如纸般流畅;HarmonyOS6带来15%流畅度提升与AI智慧功能,从解题到办公全场景重构生产力体验,轻薄机身更适配移动学习。" 临近年末,华为MatePad…

护眼灯品牌排行第一名是谁?权威第一护眼灯品牌曝光,护眼超安心

儿童青少年近视率居高不下,劣质台灯更是雪上加霜!权威数据显示,孩子每天被劣质光线照射1小时,半年内近视度数就可能明显上涨。可护眼台灯市场鱼龙混杂,虚假宣传、参数造假层出不穷,家长想给孩子选到靠谱的灯…

AI赋能智能客服:节庆日用品的爆单应对与服务升级核心

一、行业核心矛盾:短周期爆单与场景化适配的双重困境节庆日用品电商以窗花、对联等季节性品类为核心,交易呈现强周期性、爆发式订单特征。节日前30天订单量达平日15-20倍,传统人工客服响应滞后,排队时长超10分钟,用户流…

华为全场景新品发布,智慧时尚的数字生活由此开启

华为主题下载 3月16日,2022华为全屋智能及全场景新品春季发布会正式举办。伴随着全屋Wi-Fi、智能门锁、便携智能音箱HUAWEISoundJoy、HUAWEIP50系列新色、HUAWEInova9SE、HUAWEIMatePadPaper、HUAWEIFreeBuds4E等多款新品发布,华为终端云服务充分发挥…

ToDesk共享屏幕拍照教程,超详细指南

喜欢被拍照但奈何身边的亲友却技术不佳经常无法帮助自己拍摄到令人满意的照片怎么办?一遍一遍重拍不仅有点折腾人并且消磨耐心和情绪也难高效和开心。难道对此就没有其他解决之道了吗?当然不是,通过ToDesk远程控制完成共享屏幕拍照就能轻松搞…

个人数据管理系统

个人数据管理系统一、系统概述该系统基于SpringBoot框架开发,目的是为用户提供个人信息管理的服务。系统功能包括用户登录与权限管理、个人信息管理、数据导入导出、安全与隐私保护等模块。系统设计时注重用户数据的安全性和隐私保护,采用MD5加密存储用户…

智能表格识别技术融合深度学习与计算机视觉,突破传统表格数字化瓶颈

当财务人员面对跨页合并的财务报表,当法务团队需要从数百页合同附件中提取数据,当研究人员试图分析历年格式不一的统计报表时,表格数字化的巨大成本与误差始终难以避免。一种基于深度学习与计算机视觉的表格识别解决方案,直击这一…

【开题答辩全过程】以 农田水井灌溉系统为例,包含答辩的问题和答案

个人简介 一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等 开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。 感谢大家…

技术团队OKR季度/年度复盘全指南:从流程落地到效能提升

在技术驱动的企业中,OKR(目标与关键成果)不仅是战略落地的工具,更是团队协同、效能提升的核心抓手。而复盘作为OKR闭环的最后一环,其价值远超总结进度——对技术团队而言,它既是检验技术目标合理性、沉淀研…

【力扣hot100题】除了自身以外数组的乘积(11)

给你一个整数数组 nums,返回 数组 answer ,其中 answer[i] 等于 nums 中除了 nums[i] 之外其余各元素的乘积 。题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整数范围内。请 不要使用除法,且在 O(n) 时间复杂度…

新手也能建博客?Halo 手把手教你,cpolar 帮你把博客 “搬” 到全网

Halo 是一款适合新手的建站工具,功能聚焦于个人博客搭建,提供傻瓜式编辑器,支持拖拽排版、代码高亮和主题切换,还有丰富的插件可以扩展功能,比如添加评论系统、优化 SEO 等。它适合学生、内容创作者、想拥有个人展示平…

实体商家免费入驻家家有平台,成为联盟商家超详细教程!

想解锁海量客源、沉淀私域流量,还能拿盈利分红?免费入驻家家有联盟商家,零成本享曝光、引客流、增收益,手把手教程帮你快速入驻,轻松盘活店铺生意!01成为联盟商家核心优势1.共享平台会员资源,精…

【开题答辩全过程】以 基于Java的慕课点评网站为例,包含答辩的问题和答案

个人简介 一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等 开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。 感谢大家…

【开题答辩全过程】以 培训信息管理系统为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

知识库 × AI写作:打通公文写作的“最后一公里”

公文写作从来不只是文字功夫——它是一场与时间、准确性、合规性和信息完整性的拉锯战。写作者常常陷入三大困境:资料散:政策文件、历史稿、数据报表分散各处,查找耗时;引用难:不敢轻易引用,怕版本错误、出…

记忆力革命:学习力的核心与其目脑力的科技探索

我们正站在教育范式转换的十字路口。过去,“题海战术”是应对知识爆炸的主要手段;如今,教育者、学生和家长逐渐认识到,决定学习效率与成绩上限的,往往是处理信息的“底层操作系统”——记忆力。优质的记忆力远非机械的…

网络基础概念

⽹络基础概念 ⽹络发展 独⽴模式: 计算机之间相互独⽴;(在此阶段下:资源无法共享、协作效率低下、运维成本高) ⽹络互联: 多台计算机连接在⼀起, 完成数据共享;(网络互联实现数据共享优势是打破资源孤岛,但是也带来…

【力扣hot100题】缺失的第一个正数(12)

给你一个未排序的整数数组 nums ,请你找出其中没有出现的最小的正整数。 请你实现时间复杂度为 O(n) 并且只使用常数级别额外空间的解决方案。 示例 1: 输入:nums [1,2,0] 输出:3 解释:范围 [1,2] 中的数字都在数组…

亲测好用!MBA毕业论文必备TOP9 AI论文软件

亲测好用!MBA毕业论文必备TOP9 AI论文软件 2026年MBA论文写作工具测评:为何值得一看 随着AI技术在学术领域的不断渗透,越来越多的MBA学生开始依赖智能工具提升论文写作效率。然而,面对市场上琳琅满目的AI论文软件,如何…