什么是具身智能

 具身智能(Embodied Intelligence)是人工智能与机器人学交叉的前沿领域,强调智能体通过身体与环境的动态交互实现自主学习和进化,其核心在于将感知、行动与认知深度融合‌。通俗地讲,就是机器人或者智能系统在物理环境中通过感知、行动和交互实现的智能能力。

具身智能是AI发展与应用的下半场,近期来国家将具身智能作为关键未来产业,各地政府重点发展和培育具身智能这一潜力行业。具身智能等未来产业是经济增长,科技进步的引擎,因此也是各国的竞争高地。

关注具身智能有一段时间了,大模型火了之后更是让具身智能焕发新的生命力,本文主要学习和分享具身智能的相关知识,一起感受它的魅力。

产业概述

具身智能是指通过身体与环境的动态互动,实现对世界的感知、认知和行为控制的智能系统。具身智能的科学立论是真正的理解源于行为实践,通过实际的行动和交互,机器或个体才能深刻地理解和具象化场景与概念。

图片

具身智能架构定义--来源于头豹研究院

“知行合一”是具身智能的核心科学理论,认为只抽象化概念,但并不进行实际 的操作行动,人工智能是无法达到AGI的。

具身智能是指通过身体与环境的动态互动,实现对世界的感知、认知和行为控制的智能系统,它强调智能行为的产生不仅仅依赖于内部处理,而是与身体的能力、感知和动作紧密相关。 

根据具身智能的技术实现逻辑,“知”是建立在“行”之上,只有机器真正的行动才能完全具象化地理解某一个场景。例如,卧室这一概念具备睡觉和休息等行为特征,而人在概念层是无法真正只通过睡觉和休息这一抽象概念去完全理解卧室的场景,只有通过完成坐上椅子,躺在床上等行为任务才能真正地理解卧室场景。同理,人工智能只有真正在行为上实现才能代表它真正地理解了该场景。

具体知识可以追溯至古老的汉字文化中。在中国的甲骨文中,许多字都是通过行为的表征所来刻画的一个概念,比如“关”是两个门要关闭的象形文字。人只有通过关闭东西的动作才能真正理解该文字所要代表的含义,因此,理解行为,实现行为是理解概念及场景的关键,这也是具身智能核心的科学立论。

发展历史

具身智能并不是近几年的概念,只是大模型的崛起加速了具身智能的发展和使得具身智能成为焦点。

具身智能发展历经三大阶段:第一阶段为具身智能概念提出阶段,核心在于哲学概念的思考与讨论;第二阶段为人工智能和机器人控制的技术积累;第三阶段则为大模型为具身之带来的技术范式突破。

图片

具身智能发展历程--来源于头豹研究院

◼ 1950-1990:具身智能概念提出阶段,核心在于哲学思考 

1950年,艾伦·图灵在其论文《Computing Machinery and Intelligence》中首次提出具身智能的概念,随后的40年间,在人工智能领域,众多针对符号主义局限性的思考蔓延,随着“莫拉维克” 悖论理论在学术界得到广泛认同,智能与身体和环境的紧密联系被广泛强调。 

◼ 2000-2019:技术积累与实验室探索阶段 

自二十一世纪初以来,人工智能领域经历了显著的技术突破,尤其是深度学习网络的发展极大地增强了机器在复杂逻辑推理方面的能力。通过结合深度学习和强化学习技术,机器人已能在如物体识别等简单重复的任务中有效运作。此外,人工智能在围棋、象棋等需要高度抽象思维的领域取得了显著进展。尽管在这一阶段机器人尚未达到真正意义上的智能,主要仍限于推导已知信息和执行重复指令,但这些技术进步为实现更高级的具身智能奠定了坚实的基础。 

◼ 2019-2024:人工智能技术深化引领具身智能走向技术突破阶段 

进入2020年代,大规模模型技术的先进发展为具身智能引入了新的技术范式。利用基于Transformer架构的注意力机制,这些大型模型能够将复杂的文本信息转化为向量表示,实现与人类的语音交互的高水平对话。同时,产业界也开始探索将这些先进的大模型与视觉处理技术结合,使得机器人能够通过视觉和语音交互来精确执行具体任务。到了2023年,宇树科技,智元机器人,包括特斯拉和小米在内的科技巨头相继推出了1:1比例的人形机器人,这些机器人能够执行基本的任务规划和操作,展示了具身智能在实际应用中的新里程碑。

图片

具身智能系统框架--来源于IDC

行业现状

◼ 市场情况

具身智能的市场潜力巨大,随着社会经济的发展和人们对智能化生活的需求不断增加,具身智能技术在各个领域的应用前景十分广阔。

在制造业领域,随着智能制造的推进,具身智能机器人将成为实现生产自动化、智能化的关键设备。在服务业领域,具身智能技术的应用将为人们提供更加便捷、高效的服务体验,提升服务效率和质量。在医疗领域,具身智能技术将在手术辅助、康复治疗、护理等方面发挥重要作用,为患者提供更加精准、个性化的医疗服务。

据市场研究机构预测,未来几年全球具身智能市场规模将保持高速增长态势,市场规模有望在未来十年内实现数倍甚至数十倍的增长。在中国,随着制造业转型升级、人口老龄化加剧以及消费升级的推动,具身智能市场需求将持续增长,市场前景极为广阔。

◼ 技术进展

近年来,具身智能技术多点突破,技术上取得迅猛发展。

在感知技术方面,高精度传感器的不断涌现,使得智能体能够更精准地感知环境信息,为智能体的决策提供更丰富的数据支持。新型触觉传感器能够模拟人类皮肤的触觉感受,让智能体在与物体交互时,从而实现更精细的操作。在决策与控制算法上,强化学习和深度学习的融合应用,大幅提升了智能体的自主决策能力。通过大量的训练数据和复杂的环境模拟,智能体能够实现更加智能、灵活的行为控制。在机器人路径规划中,基于强化学习的算法可以使机器人在复杂的环境中快速找到最优路径,同时避开障碍物,提高行动效率。

如今得益于大模型的快速发展,如今具身智能的大脑也越来越聪明,使其在智能化方面越来越强大,未来的机器人将可以极大提高生产力。

◼ 知名企业

具身智能的未来极富想象力,因此国内外多家公司纷纷布局该领域,除了诸如波士顿动力,Figure AI等国外巨头外,国内也诞生了许多明星企业,宇树科技,智元机器人,优必选,众擎机器人等深圳机器人八大金刚。除此之外,许多大厂也跨界造机器人,例如特斯拉,小米和小鹏等公司也布局具身智能,机器人不仅是未来的前景产业,短期内在造车上也能很快体现它的价值。

另外,有一些不造机器人,但是”卖铲子“的企业也在做大蛋糕,例如英伟达不仅是GPU的巨头,更是推出了Project GR00T人形机器人基础模型,Isaac机器人平台和专用芯片等,极大推动了具身智能产业的发展。

图片

具身智能产业链图谱--来源于头豹研究院

未来发展

具身智能不仅是当代新兴科技发展的重要方向,也是一个高潜力的行业市场。未来想要更好发展可以考虑做好以下几点:

◼ 重视研发投入

具身智能对软硬件以及算法都有极高的要求,现在不管是AI还是具身智能都还是初始阶段,现阶段各家企业可以加大研发力度,重视AI大模型技术,相关算法与重点零配件等研发,形成自己独特的竞争优势。同时想办法降低供应链的成本,只有人人用得起,价格不算太贵的机器人市场前景才更好,当然这需要时间。

图片

具身智能关键技术--来源于IDC

◼ 加强产业联合

具身智能行业呈现出蓬勃发展的态势,吸引了大量的企业、资本和人才的涌入。未来可以考虑聚焦于细分市场,以创新的技术和灵活的市场策略,在特定领域取得了独特的竞争优势。

一些专注于农业机器人研发的初创企业,针对农业生产的特点和需求,开发出了具有除草、采摘、灌溉等功能的智能农业机器人,为农业现代化提供了新的解决方案。针对老年人群体,推出保姆型的机器人,提供情感陪伴和生活照料等功能。针对制造业或者危险工种,推出劳作型机器人,可以提高生产效率,除此之外,物流,安保,医疗,服务等行业也是具身智能大展身手的好地方。

随着行业的发展,具身智能的产业生态逐渐形成,产业链上下游企业之间的合作不断加强。从传感器、芯片等核心零部件的研发生产,到机器人本体的制造和系统集成,再到应用场景的开发和运营,各个环节的企业相互协作,共同推动具身智能产业的发展。行业协会、科研机构等也在技术标准制定、人才培养、技术交流等方面发挥着重要作用,为具身智能行业的健康发展提供了有力支持。

◼ 建立业界统一标准

如今市场上的具身智能公司可谓百花齐放,政府的支持与资本的青睐使得具身智能公司成为宠儿,例如热度不减的人形机器人领域近年来涌现出了不同结构形态、不同技术方向的相关产品,为统一人形机器人领域的技术语言,规范人形机器人技术产品的发展路径,也需要定义人形机器人领域相关术语,并对人形机器人领域产品进行分类分级。此外一些技术细节,例如零配件等标准也需建立起来。

同时随着具身智能的广泛应用,其伦理和安全问题也日益受到关注,相关规则也需统一。

另外,数据非常重要,在信息时代数据就是燃料。只有丰富的数据提供给机器人训练,模仿学习,机器人才会越来越聪明。目前业界比较创新的是智元机器人推出了世界上首个大规模高质量机器人学习数据集AgiBot World,AgiBot World配套提供了基准模型、基准测试并构建出一套完整的生态系统,让高质量机器人数据在学术界与工业界都触手可及,具身智能领域的“ImageNet时刻”已经到来!

图片

智元机器人AgiBot World介绍

总结

英伟达创始人黄仁勋曾说过机器人将引领未来产业革命,很可能成为世界上最大的产业。具身智能会是新的技术革命,会使人类社会跨越另一个层次,对此我们不必恐慌,欣然看待,相信带给我们的必是好的影响。

参考资料:

- 头豹研究院

- IDC

- 北京社科院王鹏

                                                    关注一下,后续有更多精彩内容~

图片

                                

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/73754.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

git命令使用小记(打补丁)

需求:需要从开发分支提取本人提交代码,然后合并到主分支 一、制作补丁包 mkdir -p patches for commit in $(git log commitA..commitB --author"username" --reverse --prettyformat:"%h"); do …

mapbox基础,加载popup弹出窗

👨‍⚕️ 主页: gis分享者 👨‍⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏:mapbox 从入门到精通 文章目录 一、🍀前言1.1 ☘️mapboxgl.Map 地图对象1.2 ☘️mapboxgl.Map style属性1.3 ☘️popup 弹出窗 api1.3.1 ☘️构造函数1.…

C++11--(1)

目录 1.列表初始化 {}初始化 C98中 C11中 内置置类型和自定义类型 创建对象也适用 std::initializer_list 2.变量类型推导 auto C98 C11 decltype nullptr 3.范围for循环 4.STL中一些变化 array 1.创建和初始化 2.访问元素 ​编辑 3.修改操作 4.支持迭代器…

Promise的状态和方法是什么?

Promise 的状态和方法 1. Promise 的状态 一个 Promise 可以处于以下三种状态之一: - Pending(待定):初始状态,表示异步操作正在进行中,Promise 还没有被解决或拒绝。 - Fulfilled(已完成&…

Windows云服务器支持哪些数据库管理系统?

Windows云服务器因其良好的兼容性和企业级支持,广泛用于网站托管、企业管理系统、金融应用、数据分析等场景。在这些应用中,数据库管理系统(DBMS)起着至关重要的作用。Windows 服务器支持多种数据库,包括关系型数据库(SQL)和非关系型数据库(N…

MongoDB 实际工作中应用场景

博主介绍:✌全网粉丝5W,全栈开发工程师,从事多年软件开发,在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战,博主也曾写过优秀论文,查重率极低,在这方面有丰富的经验…

03 相机标定图像采集

学完本文,您将获取一下技能: 1:如何提升标定质量,如选择标定板,标定图像采集的注意事项, 2:实现标定图像自动筛选的代码 3:量产场景如何通过一张图像来标定相机 为了实现良好的标定效果,以下因素在标定数据采集前必须设置得当。 标定板选择 标定板尺寸准确材料平…

GitHub美化个人主页3D图表显示配置操作

这个功能主要是用的这个开源仓库:https://github.com/yoshi389111/github-profile-3d-contrib 想看效果的话,我的个人主页:https://github.com/Sjj1024 开始操作 1.创建自己的github主页属性项目——跟你github用户名一致即可,…

buu-jarvisoj_fm-好久不见52

格式化字符串漏洞题 x等于4x等于4​​​​​​​x等于4​​​​​​​x等于4 可以知道是第11个参数,%11$ 定位到这个位置,然后%n往这个位置写入4 1.先用pwndbg调试得到偏移量 2.查看获取x的地址 3.构造ROP链,发送连接 from pwn import *# …

AwesomeQt分享3(含源码)

AwesomeQt 这个项目包含了多个Qt组件的使用示例,旨在展示Qt各种强大功能的实现方式。 源码分享 github: awesome_Qtgitee: 后续同步 项目进度 QCustomPlot曲线控件示例 支持排序和筛选的列表控件示例 支持排序和筛选的表格控件示例 属性表示例 Dock窗口示例 自绘…

ubuntu 安装 g++

文章目录 前提一、安装 g1.1 安装1.2 验证 前提 安装 tflite_support 报错 error: subprocess-exited-with-error RuntimeError: Unsupported compiler -- at least C11 support is needed!一、安装 g 1.1 安装 # 安装编译工具链(如g)和依赖库 sudo …

【NLP 50、损失函数 KL散度】

目录 一、定义与公式 1.核心定义 2.数学公式 3.KL散度与交叉熵的关系 二、使用场景 1.生成模型与变分推断 2.知识蒸馏 3.模型评估与优化 4.信息论与编码优化 三、原理与特性 1.信息论视角 ​2.优化目标 3.​局限性 四、代码示例 代码运行流程 核心代码解析 抵达梦想靠的不是狂热…

使用QT画带有透明效果的图

分辨率&#xff1a;24X24 最大圆 代码: #include <QApplication> #include <QImage> #include <QPainter>int main(int argc, char *argv[]) {QImage image(QSize(24,24),QImage::Format_ARGB32);image.fill(QColor(0,0,0,0));QPainter paint(&image);…

【Unity网络编程知识】使用Socket实现简单TCP通讯

1、Socket的常用属性和方法 创建Socket TCP流套接字 Socket socketTcp new Socket(AddressFamily.InterNetwork, SocketType.Stream, ProtocolType.Tcp); 1.1 常用属性 1&#xff09;套接字的连接状态 socketTcp.Connected 2&#xff09;获取套接字的类型 socketTcp.So…

青少年编程与数学 02-013 初中数学知识点 02课题、概要

青少年编程与数学 02-013 初中数学知识点 02课题、概要 一、数与代数二、图形与几何三、统计与概率四、综合与实践五、课程理念与目标 根据2022年版义务教育数学课程标准&#xff0c;初中数学知识点可以总结为以下四大领域。 一、数与代数 数与式 有理数与实数&#xff1a;理解…

深入探索 libarchive

深入探索 libarchive&#xff1a;跨平台归档处理的终极解决方案 一、背景与历史沿革 1.1 归档处理的演进之路 从1979年tar格式的诞生到现代云存储时代&#xff0c;归档技术经历了四个关键阶段&#xff1a; Unix时代&#xff1a;tar/cpio主导系统备份互联网黎明期&#xff1…

2025最新“科研创新与智能化转型“暨AI智能体开发与大语言模型的本地化部署、优化技术实践

第一章、智能体(Agent)入门 1、智能体&#xff08;Agent&#xff09;概述&#xff08;什么是智能体&#xff1f;智能体的类型和应用场景、典型的智能体应用&#xff0c;如&#xff1a;Google Data Science Agent等&#xff09; 2、智能体&#xff08;Agent&#xff09;与大语…

Yolo_v8的安装测试

前言 如何安装Python版本的Yolo&#xff0c;有一段时间不用了&#xff0c;Yolo的版本也在不断地发展&#xff0c;所以重新安装了运行了一下&#xff0c;记录了下来&#xff0c;供参考。 一、搭建环境 1.1、创建Pycharm工程 首先创建好一个空白的工程&#xff0c;如下图&…

时尚界正在试图用AI,创造更多冲击力

数字艺术正以深度融合的方式&#xff0c;在时尚、游戏、影视等行业实现跨界合作&#xff0c;催生了多样化的商业模式&#xff0c;为创作者和品牌带来更多机会&#xff0c;数字艺术更是突破了传统艺术的限制&#xff0c;以趣味触达用户&#xff0c;尤其吸引了年轻一代的消费群体…

蓝桥杯省模拟赛 01串个数

问题描述 请问有多少个长度为 24 的 01 串&#xff0c;满足任意 5 个连续的位置中不超过 3 个位置的值为 1。 所有长度为24的01串组合有2*24种 思路&#xff1a;遍历所有长度为24的01串组合&#xff0c;选择出符合题意的 #include<iostream> #include<cmath> us…