【必学收藏】智能体是什么?深入解析ReAct范式,助力AI开发者快速上手大模型智能体技术

本文解析AI智能体概念及ReAct范式,介绍不同来源对智能体的定义,详细阐述ReAct的核心思想——将推理与行动交错联合,形成Thought->Act->Observe工作流程。通过案例演示ReAct应用,探讨工具技术发展路径,总结智能体两大特征:LLM作为规划器进行自主推理,以及通过工具与外界交互获取信息,为理解大模型智能体提供基础框架。

1、 智能体是什么?

智能体这个词就像哈姆雷特,不同的人对其有不同的定义。

人工智能的经典巨著《人工智能:现代方法》将智能体定义为:任何通过传感器(sensor)感知环境(environment)并通过执行器(actuator)作用于该环境的事物都可以被视为智能体(agent)。

Google 将智能体定义为:AI 智能体是使用 AI 来实现目标并代表用户完成任务的软件系统。其表现出了推理、规划和记忆能力,并且具有一定的自主性,能够自主学习、适应和做出决定。

从概念上很难有效地理解智能体,所以笔者就换了个思路,先看具体的案例。

2、 ReAct

姚顺雨提出的 ReAct[3] 是一个基于 LLM 的智能体范式,这已得到广泛认可。

在 ReAct 之前,LLM 在完成任务时常采用这两类策略:

  • • 纯推理(reason only):例如 Chain-of-Thought(思维链), 只让模型内部展开推理。这类方法能分解问题,但容易出现幻觉(hallucination)和错误累积。
  • • 纯行动(act only):例如让模型输出行为/动作,与外界环境或 API 交互(比如查询知识库或执行步进任务)。这类方法能获取外部信息,但缺乏高层推理和规划能力。

ReAct 的核心思想是将推理与行动交错联合起来,形成一个更强、更鲁棒的任务求解范式:即通过模型交替产生推理内容与行动指令,并结合实际执行结果来进一步推理,从而实现推理与行动的协同

2.1. Thought -> Act -> Observe

结合论文中的示例,比较容易理解其工作流程。

  1. LLM 思考任务目标、历史反馈,明确下一步行动的逻辑依据;
  2. LLM 生成下一步的行动,示例为知识问答,所以都是 Search 指令;
  3. 执行与外部交互的动作,将外部反馈传递给 LLM,为下一轮 TAO 提供信息。

仅从论文中的示例来看,ReAct 是一种 prompt 级别的范式设计,所以笔者决定通过手动操作来演示。

2.2. 人工 Act 示例

system 提示词来自旧版本的 LangChain:

Answer the following questions as best you can. You have access to the following tools: Search: A search engine. Usefulforwhen you need to answer questions about current events. Input should be a search query. Calculator: Usefulforwhen you need to answer questions about math. The way you use the tools is by specifying a json blob. Specifically, this json should have a`action`key(with the name of the tool to use)and a`action_input`key(with the input to the tool going here). The only values that should beinthe"action"field are: Search, Calculator The$JSON_BLOBshould only contain a SINGLE action,doNOTreturna list of multiple actions. Here is an example of a valid$JSON_BLOB:{"action":$TOOL_NAME,"action_input":$INPUT}ALWAYS use the following format: Question: the input question you must answer Thought: you should always think about what todoAction:$JSON_BLOBObservation: the result of the action...(this Thought/Action/Observation can repeat Ntimes)Thought: I now know the final answer Final Answer: the final answer to the original input question Begin!Reminder to always use the exact characters`Final Answer`when responding.

这样发起 LLM 调用,需要注意 stop 的设置:

client.chat.completions.create(model="deepseek-chat",messages=[{"role":"system","content":system_prompt},{"role":"user","content":user_prompt},],temperature=0,stream=False, stop=["Observation:"])

第一轮

请求LLM:

Question: 赵二狗的儿子是谁?他现在的年龄的2次方是多少?

LLM响应:

Thought: 我需要先找出赵二狗的儿子是谁,然后获取他现在的年龄,最后计算年龄的平方。由于这是一个关于具体人物的问题,我需要使用搜索工具来查找相关信息。 Action:{"action":"Search","action_input":"赵二狗 儿子"}

人工搜索:

赵二狗的儿子是钱小猫

第二轮

请求LLM:

Question: 赵二狗的儿子是谁?他现在的年龄的2次方是多少? This was your previous work(but I haven't seen any of it!I only see what youreturnas final answer): Thought: 我需要先找出赵二狗的儿子是谁,然后获取他现在的年龄,最后计算年龄的平方。由于这是一个关于具体人物的问题,我需要使用搜索工具来查找相关信息。 Action:{"action":"Search","action_input":"赵二狗 儿子"}Observation: 赵二狗的儿子是钱小猫 Thought:

LLM响应:

Thought: 现在我知道了赵二狗的儿子是钱小猫。接下来我需要查找钱小猫现在的年龄。由于年龄可能随时间变化,我需要搜索最新的信息。 Action:{"action":"Search","action_input":"钱小猫 年龄"}

人工搜索:

钱小猫今年9岁

第三轮

请求LLM:

Question: 赵二狗的儿子是谁?他现在的年龄的2次方是多少? This was your previous work(but I haven't seen any of it!I only see what youreturnas final answer): Thought: 我需要先找出赵二狗的儿子是谁,然后获取他现在的年龄,最后计算年龄的平方。由于这是一个关于具体人物的问题,我需要使用搜索工具来查找相关信息。 Action:{"action":"Search","action_input":"赵二狗 儿子"}Observation: 赵二狗的儿子是钱小猫 Thought: 现在我知道了赵二狗的儿子是钱小猫。接下来我需要查找钱小猫现在的年龄。由于年龄可能随时间变化,我需要搜索最新的信息。 Action:{"action":"Search","action_input":"钱小猫 年龄"}Observation: 钱小猫今年9岁 Thought:

LLM响应:

Thought: 现在我知道钱小猫今年9岁。接下来我需要计算他年龄的平方,即9的2次方。这可以通过计算器工具来完成。 Action:{"action":"Calculator","action_input":"9 ** 2"}

人工计算:

Answer: 81

第四轮

请求LLM:

Question: 赵二狗的儿子是谁?他现在的年龄的2次方是多少? This was your previous work(but I haven't seen any of it!I only see what youreturnas final answer): Thought: 我需要先找出赵二狗的儿子是谁,然后获取他现在的年龄,最后计算年龄的平方。由于这是一个关于具体人物的问题,我需要使用搜索工具来查找相关信息。 Action:{"action":"Search","action_input":"赵二狗 儿子"}Observation: 赵二狗的儿子是钱小猫 Thought: 现在我知道了赵二狗的儿子是钱小猫。接下来我需要查找钱小猫现在的年龄。由于年龄可能随时间变化,我需要搜索最新的信息。 Action:{"action":"Search","action_input":"钱小猫 年龄"}Observation: 钱小猫今年9岁 Thought: 现在我知道钱小猫今年9岁。接下来我需要计算他年龄的平方,即9的2次方。这可以通过计算器工具来完成。 Action:{"action":"Calculator","action_input":"9 ** 2"}Observation: Answer:81Thought:

LLM响应:

赵二狗的儿子是钱小猫,他今年9岁,年龄的平方是81。 Final Answer: 赵二狗的儿子是钱小猫,他现在的年龄的2次方是81。

2.3. 工具的发展

在姚顺雨等人于2022年发表 ReAct 论文时,工具(tools)还只能通过提示词进行定义。然而自那时起,工具相关技术迅速演进,在功能定义、调用方式与应用范围等方面都取得了显著进展。

其中的一条线是训练模型学会使用工具。Meta 于2023年发表的 Toolformer[4] 可以说是一个里程碑,今天的主流大模型都在做 Toolformer 类似目标的后训练,但实现远比论文中描述的流水线更复杂、更系统化。

另外一条线是工具使用API的规范化。OpenAI 于2023年推出“函数调用”(Function Calling)特性,允许开发者在 Chat Completions API 中定义函数接口(函数签名 / JSON schema),并让模型智能输出函数名与参数供开发者执行对应动作[5];接着又于2025年发布了新的 Agents 平台及 Responses API,通过 Responses API 可以更方便地构建 agent,让模型与工具协作能力更强[6]。

3、总结


智能体在广义上难以给出明确定义,但是 ReAct 是基于 LLM 的智能体的基础范式。

从这个角度可以总结智能体的两大特征为:

  • LLM 是智能体的规划器,大模型自主推理生成 Thought,规划 Action,更复杂的范式还会进行反思 Reflection;
  • 智能体通过工具与外界产生交互,获取的 Observe 为后续规划提供信息。

    如何学习大模型 AI ?

    由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

    但是具体到个人,只能说是:

    “最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

    这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

    我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

    • ✅ 从零到一的 AI 学习路径图
    • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
    • ✅ 百度/阿里专家闭门录播课
    • ✅ 大模型当下最新行业报告
    • ✅ 真实大厂面试真题
    • ✅ 2025 最新岗位需求图谱

    所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

    ① 全套AI大模型应用开发视频教程

    (包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

    ② 大模型系统化学习路线

    作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

    ③ 大模型学习书籍&文档

    学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

    ④ AI大模型最新行业报告

    2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

    ⑤ 大模型项目实战&配套源码

    学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

    ⑥ 大模型大厂面试真题

    面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

    以上资料如何领取?

    为什么大家都在学大模型?

    最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

    不出1年,“有AI项目经验”将成为投递简历的门槛。

    风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

    这些资料真的有用吗?

    这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

    资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

    以上全套大模型资料如何领取?

    本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1124496.shtml

    如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

    相关文章

    MSRP协议:即时通信中的多媒体传输基石

    目录 一、协议起源与设计定位 二、协议架构与核心机制 2.1 传输层依赖与连接管理 2.2 消息格式与分片机制 2.3 状态报告与错误处理 三、协议优势与应用场景 3.1 突破传统限制的传输能力 3.2 灵活的拓扑支持 3.3 与SIP的深度协同 四、结语 在数字化通信飞速发展的今天…

    腾讯云渠道商:如何在CVM 上手动搭建 LNMP 环境?

    一、引言LNMP(LinuxNginxMySQLPHP)作为主流 Web 服务环境,在腾讯云 CVM 上部署仅需简单四步。本文避开复杂配置,提供极简搭建方案,助您快速构建网站运行基础。二、核心步骤1.系统准备登录 CVM 控制台创建 CentOS 实例S…

    2026亲测成都有机肥供应厂家推荐

    【有机肥】哪家好:专业深度测评在现代农业中,有机肥的使用越来越受到重视。为了帮助种植户选择合适的有机肥供应商,本文将对成都地区的有机肥供应商进行详细测评,重点推荐盖尔盖司。1. 测评背景与目的随着环保意识的增强和农业可持…

    巴耶赫利俄语网站开发

    巴耶赫利(bayeheli.com) 是一家专业的俄语网站开发团队,专注于为中国企业提供俄语市场数字化解决方案,帮助中国品牌出海俄罗斯。 核心服务 1. 俄语网站建设 定制化设计:根据俄罗斯用户习惯和文化背景设计界面 响应式布局:适配…

    收藏!字节员工转岗大模型岗拿11W月薪,传统开发的AI风口逆袭指南

    最近科技圈一个话题彻底火了——一位字节跳动的传统开发工程师,成功跨界转型算法大模型岗位后,直接在社交平台晒出了月薪11万的工资条。帖子一经发出,评论区瞬间被“羡慕哭了”“这波转型太值了”“我也想转”的留言刷屏,满屏的羡…

    【异常】Antigravity工具提示One moment, the agent is currently loading...

    一、报错内容二、报错说明 这是Antigravity工具的操作界面,当前处于智能代理(Agent)的加载状态,以下是其核心信息: 工具定位:Antigravity属于AI辅助开发类工具,核心是通过智能代理(A…

    收藏!Agent全面爆发!万字长文吃透上下文工程(小白程序员入门必备)

    1、 Agent全面爆发的前夜:上下文成为核心变量 1.1 从Chatbot到Agent:能力形态的本质跃迁 在大语言模型(LLM)大规模落地到实际产品之前,Chatbot(聊天机器人)是最主流的应用形态。这种形态的工作逻…

    基于双层优化模型的电动汽车日前-实时两阶段市场竞标策略研究报告

    MATLAB代码:基于双层优化的电动汽车日前-实时两阶段市场竞标 关键词:日前-实时市场竞标 电动汽车 双层优化 编程语言:MATLAB平台 参考文献:店主自编参考文献,可联系我查看 内容简介:代码主要做的是电动汽…

    【高录用、快见刊】第二届能源工程与污染治理国际学术会议(EEPC 2026)

    第二届能源工程与污染治理国际学术会议(EEPC 2026)将于2026年3月13-15日在大连召开,这是一个集中探讨全球能源工程与污染治理领域创新和挑战的国际学术平台。旨在汇集全球领域内的学者、研究人员、政策制定者以及业界领导者,共同探…

    干货_常用提权辅助工具推荐

    干货 | 常用提权辅助工具推荐 一、使用Windows-Exploit-Suggester解析systeminfo 1、简介 Windows-Exploit-Suggester是受Linux_Exploit_Suggester的启发而开发的一款提权辅助工具,用python开发而成,通过比对systeminfo生成的文件,从而发现…

    外卖大军:“一口热饭”的需求引发的一系列多线程社会问题与困局

    在现代都市的日常图景中,一个再平常不过的动作——点开手机,为一份即将送达的“热饭”支付费用——已成为数亿人的习惯。这份对即时温饱的朴素追求,却如同投入平静湖面的一颗石子,激荡起一连串深远而复杂的涟漪,最终汇…

    学服务器训练AI模型:5步路径助力高效入门

    想用服务器训练AI模型不少AI开发者都会陷入“看会操作、动手就崩”的困境:记混服务器连接命令、环境配置反复报错、训练时显存不足无措——纯视频学习只给流程演示,缺逻辑拆解和实操反馈,很难真正落地。我们需要通过视频内容快速提炼视频核心…

    人工电销和AI机器人功能的根本区别是什么

    “拨号两小时,沟通五分钟”“空号拒接占一半,有效线索难寻觅”“高频外呼就封号,业务中断心发慌”…… 这些电销困境,是不是正困扰着你的团队? 传统外呼模式下,人工效率低、封号风险高、数据管理乱三大痛点…

    是德科技N9020B安捷伦N9020A N9030A频谱分析仪

    N9020B是Keysight(是德科技)生产的一款高性能MXA系列信号分析仪,专为无线通信和射频测试设计,支持10 Hz至50 GHz频率范围,最高160 MHz分析带宽。 产品概述 N9020B是Keysight(原安捷伦)推出的‌M…

    HP8920A安捷伦8921A 8920B综合测试仪对讲机测试仪

    HP惠普8920A可选的合成频谱分析仪可测量400kHz~1GHz的信号,可变间距为5kHz~1GHz(全间距).显示分辩力可在每格1、2或10dB(分贝)之间进行选择。可调光标自动读出频率和幅度或者相对于基准而言的相对幅度。频谱分析仪所包括的跟踪发生…

    风靡TikTok,影响超800万辆汽车,原因竟是一根USB 线?

    风靡TikTok,影响超800万辆汽车,原因竟是一根 USB 线? Bleeping Computer 网站披露,韩国汽车制造商现代(Hyundai)和起亚(Kia)给旗下约 830 万辆汽车进行了防盗安全更新(预…

    什么是Keychain

    文章目录为什么需要keychainkeychain是由哪些部分组成keychain是如何工作的keychain的典型应用Keychain中的Key,不是算法,也不是密钥,而是一套加密和认证的规则。keychain通过对它拥有的一系列Key进行集中控制和灵活管理,为应用程…

    Angular页面跳转03,Angular 路由导航:routerLink 指令与 Router 服务 navigate 方法全解析

    在 Angular 应用开发中,路由导航是构建单页面应用(SPA)的核心能力。你在开发过程中一定会遇到两种主流的导航方式:模板中使用的routerLink指令,以及组件类中通过Router服务调用的navigate方法。本文将详细拆解这两种方…

    是德科技33522B安捷伦33621A 33622A波形发生器

    Keysight 33522B 是一款双通道波形发生器,采用Trueform 信号生成技术,旨在为电子测试和测量、通信系统验证及教育研究等领域提供高精度、低噪声的信号源。‌ 1 2 ‌核心特性与技术规格:‌ 该设备的核心优势在于 Trueform 技术,相比…

    C/C++数据结构综合设计任务分配(29人7组)[2026-01-07]

    C/C数据结构综合设计任务分配(29人7组)[2026-01-07] 一、整体任务概况 本次数据结构综合设计任务共分为7个小组,总计29人参与,每个小组负责不同的项目开发任务,每个项目包含多个功能模块,明确了各模块的问…