国内首篇!融合语言模型的多模态触觉传感器,推动机器人触觉迈向人类水平

本研究为机器人触觉提供了多个富有前景的发展方向:硬件方面通过传感器微型化、低功耗芯片及高集成封装,提升机器人手内操作的灵活性并解决高负载下的散热稳定性难题。

论文第一作者为清华大学博士、南洋理工大学博士后李寿杰,清华大学博士生吴同和人工智能硕士生徐建乐。论文通讯作者包括清华大学深圳国际研究生院副教授丁文伯,大连理工大学教授解兆谦,新加坡国立大学助理教授吴昌盛和香港城市大学教授于欣格。

随着机器人技术从「预设程序执行」向「具身智能交互」跨越,触觉感知作为理解物体属性、实现精细操作的核心感测方式,其重要性日益凸显,但当前系统在感知维度、分辨率及信号解读能力上仍远逊于人类,导致机器人往往处于「有感无知」的状态。

在此背景下,清华大学深圳国际研究生院丁文伯团队联合无界智航(Xspark AI)及多所国内外科研机构,从鸽子卓越的多光谱视觉和非成像感知机制中获得灵感,研发出了一种仿生多模态触觉传感器 SuperTac。

该系统将多光谱成像、摩擦电感测与惯性测量融为一体,并通过构建 8.5B 参数的触觉语言模型 DOVE,实现了触觉信号从底层感知到高层语义推理的突破。

相关成果作为封面元素发表于《Nature Sensors》第一期,也是国内以第一单位在该期刊发表的首篇,标志着机器人触觉感知向「人类水平」迈出了关键一步。

  • 论文标题:Biomimetic multimodal tactile sensing enables human-like robotic perception
  • 论文链接:https://www.nature.com/articles/s44460-025-00006-y

图 1 Nature Sensors 第一期封面图,SuperTac 作为核心元素在封面上进行了展示(右下角)

一、仿生逻辑:

从鸽子眼球到多模态感知架构

鸽子拥有自然界最复杂的感知系统之一,SuperTac 的硬件设计对应了其生物学特征。

图 2 仿生学设计:受鸽眼启发的高分辨率多模态触觉传感器

多光谱视觉的迁移:从视锥细胞到多通道相机

鸽子的视网膜包含多种视锥细胞,不仅能感知可见光,还拥有人类不具备的紫外线(UV)感知能力。

SuperTac 集成了小型化的多光谱成像模块,覆盖了从紫外(390 nm)、可见光(400–700 nm)到近红外(940 nm)及中红外(5.5–14.0 μm)的超宽频段。

通过引入超宽频段成像,机器人能够在单一交互中同时解析热辐射、荧光位移等深层物理信息,实现了对物体形状、纹理、颜色和温度的全面表征。

非成像感知的映射:从地磁感应到 TENG / IMU

鸽子能通过视网膜中的隐花色素等分子感知地磁场,这是一种不依赖图像的物理感知。SuperTac 在 1 mm 厚的皮肤内嵌入了摩擦纳米发电机(TENG)和惯性测量单元(IMU)。

TENG 利用接触起电原理,根据不同物体的电负性差异识别材质(准确率 95%),并实现 15 cm 内的接近觉感知。IMU 模拟生物的本体感受,捕捉 0–60 Hz 的振动及碰撞信号。通过将摩擦电与惯性信号与光场调制耦合,传感器无需密集电极阵列即可扩展出对材质极性、震动及空间姿态的感知能力。

二、核心机制:

光场调制的「智能感知层」

SuperTac 的核心竞争力在于其厚度仅为 1 mm 的光场调制多层感知皮肤。皮肤最外层的导电层采用透明的 PEDOT:PSS,通过丝网印刷技术在具有优异拉伸性能的 TPU 薄膜上形成涡旋线电极设计。这种涡旋设计能提供均匀的电学信号,结合摩擦起电机制,使皮肤在接触不同电负性物体时产生截然不同的电学反馈,从而实现高精度的材质分类与 15 cm 范围内的接近觉探测。

图 3 多光谱机理

在导电层之下,单向透视反射层充当了光学开关,其透明度受两侧光强差调节。当内部 LED 开启形成「触觉模式」时,内侧光强占据主导,反射层变为不透明状态,CMOS 单元聚焦捕捉皮肤表面的微观纹理与形变;当内部光源关闭,反射层随之变为透明,允许外部可见光透射,使传感器能够直接获取物体的 RGB 颜色信息。

紧邻其下的紫外荧光标记层则利用在近红外波段不可见但在紫外光下激发的荧光标记,实现了形变监测与物体纹理检测的解耦,确保在复杂抓取过程中能够同步捕捉切向滑动与表面细节。

图 4 相关测试指标

三、触觉语言大模型:

8.5B 参数背后的多模态融合架构

为了构建跨模态物理信号与自然语言空间的统一表征对齐,DOVE 采用了分层架构设计,其底层骨干由预训练的大语言模型 Vicuna 构成,为系统提供了强大的语言理解与逻辑推理基础。

为了处理极其复杂的触觉输入,系统并行集成了四组预训练的 CLIP(对比语言—图像预训练)模型作为模态编码器,将图像化的触觉特征(包括颜色、纹理、温度和材质信号)提取为深层特征向量。

图 5 触觉语言大模型 DOVE

DOVE 的训练通过三阶段策略实现从底层感知到高层认知的递进:首先利用 CLIP 将异构传感器信号转化为通用的图像表征;随后通过投影层将触觉特征精准对齐至语言模型空间;最后针对 Vicuna 骨干网络进行微调,使其能够结合常识对触觉指令进行复杂推理。

四、应用场景:

从物理触碰到语义逻辑的跃迁

SuperTac 提供的多模态底层数据通过 DOVE 模型的深度解析,成功实现了从单纯的「物理感知」向高层「语义认知」的跨越,赋予了机器人类人的具身交互能力。

图 6 SuperTac + DOVE 的应用场景

在基础的识别维度,DOVE 能够实时融合传感器采集的异构多模态数据,为操纵目标建立起全方位的「物理画像」。例如,在抓取实验中,面对一个未知杯子,DOVE 能准确地将其感官印象转化为人类可理解的语言:「黄色,室温,表面具有规律排布的凸起纹理,判定为金属材质」。

最高层级的应用体现在常识指引下的功能决策与推理。DOVE 不仅解析当前的物理数据,还能将实时的触觉反馈与预训练的大模型常识相结合,从而推断物体的潜在功能并做出逻辑决策。

在极具挑战性的垃圾分拣任务中,这一能力得到了充分验证:当机器人接触到乱序堆放的杂物时,DOVE 能够根据触觉反馈进行逻辑建模。例如,它会推论道:「该物体具有典型的 PET 物理特征,结合其轻薄的结构,判定为废弃的塑料饮料瓶;基于环保常识,建议将其放入可回收垃圾桶」。

五、未来方向

本研究为机器人触觉提供了多个富有前景的发展方向:硬件方面通过传感器微型化、低功耗芯片及高集成封装,提升机器人手内操作的灵活性并解决高负载下的散热稳定性难题;认知层面则依托 DOVE 模型的模态无关框架,通过优化传感器配置与专用数据集来持续增强系统的泛化能力,从而为实现自然、高效的人机交互奠定坚实基础。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1219890.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SSM医患交流系统1w127(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面

系统程序文件列表 系统项目功能:用户,医生,科室,医生预约,在线留言,科室介绍,病历信息 SSM医患交流系统开题报告 一、课题研究背景与意义 1.1 研究背景 随着互联网技术与医疗行业的深度融合,传统医患沟通模式已难以满足当下患者多样化、便捷化的就医需…

SSM医疗保险分层系统yu61r(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面

系统程序文件列表 系统项目功能:投保单位,定点医院,就诊费用 SSM医疗保险分层系统开题报告 一、课题研究背景与意义 1.1 研究背景 随着我国医疗保障体系的不断完善,全民医保覆盖范围持续扩大,参保人员群体日益多元化,不同收入、…

2026沈阳考驾照优质驾校推荐榜

2026沈阳考驾照优质驾校推荐榜 一、行业背景与筛选依据 据《2025-2026中国驾培行业发展白皮书》统计,沈阳地区年驾培需求超15万人次,其中在职人群占比62%,零基础学员占比58%。 当前市场存在资质混杂、隐形收费、练车…

北京放家具的仓库有推荐的吗?装修换房更省钱!

在北京无论是乔迁新居、装修过渡,还是企业需要额外的仓储空间,找到一个靠谱的家具寄存仓库往往是许多人的刚需。今天我们就来聊聊如何选择一家让您安心、省心、放心的专业仓库。首先,安全性必须是您考量的首要因素。…

2026国产儿童羽绒服种草清单|保暖耐穿不踩雷,宝妈闭眼入!

2026国产儿童羽绒服种草清单|保暖耐穿不踩雷,宝妈闭眼入!一、引言:寒潮来袭,给娃选对国货羽绒服才是王道 家人们,最近这气温 “咻” 地一下就降了,又到了给娃裹上羽绒服的季节!作为一个在童装穿搭领域摸爬滚打…

干货分享!GEO源码搭建核心知识点梳理,易懂好记,GEO源码搭建实战案例分析,GEO源码搭建提升你的实战能力!

干货分享!GEO源码搭建核心知识点梳理,易懂好记,GEO源码搭建实战案例分析,GEO源码搭建提升你的实战能力!2026年想靠AI获客站稳脚跟?懂行的都知道,选对GEO优化系统、做好GEO源码搭建,比瞎忙活一百场推广都管用!…

油屑双清!2026去屑控油洗发水十大品牌:泛红痒星人必入温和洗护无负担

敏感肌+油屑叠加的痛,谁懂啊!头皮泛红刺痛、一抓就痒,同时还顶着油扁塌发型,头屑藏在发丝里不敢穿深色衣——用强去屑产品怕刺激泛红加重,用温和产品又控不住油屑,陷入“越洗越敏、越屑越痒”的恶性循环。2026年…

【2025榜单】Top3均质机品牌榜:从市场规模到行业发展的全方位展望

均质机是实现物料微细化、均匀化处理的关键设备,当前行业在政策推动、下游需求升级与国产替代加速下稳步增长,2025 年中国市场规模约 50.58 亿元,全球约 154.67 亿元,2026 下半年将延续高端化、智能化趋势,竞争聚…

久咳虚证选药指南:养无极、健肺丸、润肺药的性价比对比及最终选择

在门诊中,经常遇到一些患者,咳嗽断断续续超过一两个月,甚至更久。他们最困惑的是:“医生,我试了各种止咳药、消炎药,为什么咳嗽就是‘断不了根’?而且越咳喉咙越干,痰也越来越少。” 这其实点出了一个临床上非…

0-16岁童装羽绒服选购指南|高性价比品牌榜单,宝妈闭眼入不踩坑

0-16岁童装羽绒服选购指南|高性价比品牌榜单,宝妈闭眼入不踩坑一、引言:寒冬囤货刚需!给娃选羽绒服,别只看颜值不看 “硬实力” 当凛冽寒风宣告冬天的到来,宝妈们又开启了一年一度的童装羽绒服 “选购大战”。想…

北京放家具的仓库有推荐的吗?

在北京空间总显得格外珍贵,家中的物品悄然增多。换季的衣物、孩子的玩具、闲置的书籍、备用的杂物、装修时的家具……找到既安全可靠,又便捷实惠的仓储空间,存放这些暂时不用却舍不得丢弃的物品。在北京放家具的仓库…

2026育发液哪个牌子效果最好?养发热门十大防脱生发品牌排行榜公布,榜首惊艳

斑秃:边界清晰的圆形或椭圆形脱发斑,俗称“鬼剃头”。可能由遗传、自身免疫、精神压力、内分泌失调或感染等多种因素引发,约8.4%~25.0%的斑秃患者有阳性家族史。 斑秃怎么办?在调整生活作息、饮食外,可搭配外用防…

IEPAF01现场电源模块

IEPAF01 现场电源模块IEPAF01 是一款用于工业自动化系统的 现场电源模块,主要负责为现场设备及相关控制模块提供稳定、可靠的电源支持,是控制系统中不可或缺的基础单元之一。主要功能与特点:为现场 I/O 模块及控制单元提供稳定直流电源具备电…

Java毕设选题推荐:基于springboot+协同过滤课程推荐的线上安全教育平台基于协同过滤推荐算法的线上安全教育平台设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

IEPAS01交流电系统电源

IEPAS01 交流电系统电源 IEPAS01 是一款用于工业自动化系统的 交流电系统电源模块,主要负责将现场交流电源进行处理与分配,为控制系统及相关模块提供稳定、可靠的电力支持,是系统供电体系中的关键组成部分。 主要功能与特点: 接…

Java毕设选题推荐:基于web的美食探店平台基于springboot的校园周边美食探索及分享平台的设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

IEPAS02电源模块

IEPAS02 电源模块IEPAS02 是一款应用于工业自动化系统的 电源模块,主要用于系统级供电与电源管理,为控制器及相关功能模块提供稳定、可靠的电力支持,是工业控制系统电源架构中的重要组成部分。主要功能与特点:接收系统侧电源并进行…

【Python时序预测系列】建立CNN-LSTM-Transformer融合模型实现多变量时序预测(案例+源码)

这是我的第449篇原创文章。一、引言CNN(卷积)擅长抓“局部模式”,LSTM(长短时记忆网络)擅长记住“时间上的因果和长期依赖”,Transformer(自注意力)擅长把序列里任意两个时刻相互比较…

计算机Java毕设实战-基于springboot的面向企业用户的复合型活动基地活动中心线上管理系统会议室预订系统【完整源码+LW+部署说明+演示视频,全bao一条龙等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

计算机Java毕设实战-基于协同过滤推荐算法的在线教育平台基于springboot+协同过滤课程推荐的线上安全教育平台【完整源码+LW+部署说明+演示视频,全bao一条龙等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…