四、Agent原理与ReAct 架构详解 ——《动手学Agent应用开发》学习心得

news/2025/11/16 0:10:16/文章来源:https://www.cnblogs.com/laoluo2025/p/19210596

四、Agent原理与ReAct 架构详解 ——《动手学Agent应用开发》学习心得

==================================================================================

最近参加了Datawhale开源组织举办的组队学习。本篇的学习内容是基础原理-选修:三、Agent原理与最简实践
【教程地址】
https://gitlink.org.cn/datawhalechina/build_good_agents

==================================================================================

1、Agent 核心概念

1.1、Agent 的本质公式

大模型 + 记忆 + 工具 = Agent

Agent(智能体)是能够感知环境、做出决策并采取行动以实现特定目标的自主实体。与传统程序相比,Agent 具备以下核心特征:

  • 自主性:无需人工干预即可独立运行
  • 反应性:能对环境变化做出实时响应
  • 主动性:主动追求目标而非被动响应
  • 社会性:能与其他 Agent 或人类进行交互

当前主流的 Agent 架构

  1. ReAct(推理+行动)
    • 将思考和行动融合在每个步骤中
    • 通过观察-思考-行动的循环实现决策
    • 适合需要实时响应的动态任务
  2. Plan-and-Solve(规划-求解)
    • 先规划再执行的解耦式架构
    • 制定详细计划后严格按照步骤执行
    • 适合需要长远规划的复杂任务
  3. Reflection(反思优化)
    • 执行→反思→优化的三步循环
    • 通过自我评估和迭代改进提升质量
    • 适合追求高精度的关键任务

1.2、ReAct 架构详解

ReAct(Reasoning + Acting)是目前最简洁有效的 Agent 架构,其核心思想是:

观察环境 → 思考推理 → 采取行动 → 观察结果 → 循环

ReAct 决策循环

  1. Thought:基于当前观察进行推理
  2. Action:选择并执行具体行动
  3. Observation:观察行动结果
  4. 循环:根据新观察继续思考
image

示例流程

用户:"北京天气如何?"
Thought:用户询问天气,需要获取北京当前天气信息
Action:weather_query(location="北京")
Observation:{"temperature": 25, "condition": "晴"}
Thought:已获得天气数据,可以回复用户
Action:回复"北京今天25度,晴天"

1.3、其他主流 Agent 架构

Plan-and-Solve Agent

  • 工作原理:由 Lei Wang 在2023年提出,将整个流程解耦为规划阶段和执行阶段
  • 规划阶段:接收完整问题,分解任务并制定分步骤的行动计划
  • 执行阶段:严格按照计划执行,保持目标一致性,避免中间步骤迷失方向
  • 优势:在处理多步骤复杂任务时能够保持更高的目标一致性

Reflection Agent

  • 核心思想:灵感来源于人类学习过程,通过执行→反思→优化的循环提升质量
  • 执行阶段:使用 ReAct 或 Plan-and-Solve 生成初步解决方案
  • 反思阶段:调用独立的 LLM 实例担任"评审员",评估事实性、逻辑性、效率等维度
  • 优化阶段:基于反馈内容对初稿进行修正,生成更完善的修订稿

LangChain Agent

  • 基于链式调用的 Agent 框架
  • 支持多种提示模板
  • 丰富的工具集成生态
  • 适合复杂工作流

AutoGPT

  • 完全自主的目标追求
  • 长期记忆系统
  • 自我提示生成
  • 适合开放式任务

MetaGPT:

  • 软件开发的 Multi-Agent 协作框架
  • 模拟真实软件团队角色分工
  • 产品经理、架构师、工程师等角色扮演
  • 适合自动化软件开发任务

CAMELAI:

  • 基于角色扮演的对话式 Agent 框架
  • 多 Agent 协作完成复杂任务
  • 强调角色定义和通信协议
  • 适合创意写作、教育培训等场景

架构对比

架构 复杂度 控制力 适用场景
ReAct 简单决策任务
Plan-and-Solve 多步骤复杂任务
Reflection 高精度关键任务
LangChain 复杂工作流
AutoGPT 自主探索任务
MetaGPT 软件开发自动化
CAMELAI 角色扮演对话任务

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/966591.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

InterStellar

InterStellar 遥望无尽星际, 未知与神秘交错, 光芒与黑暗叠影。 感叹时空的伟大, 改变了容颜, 吹散人间爱意。 感叹爱的伟大, 聚如一团火, 散是满天星。 太空,太空, 你却又如此多情。

三、Agent 应用开发与落地全景 ——《动手学Agent应用开发》学习心得

三、Agent 应用开发与落地全景 ——《动手学Agent应用开发》学习心得 ================================================================================== 最近参加了Datawhale开源组织举办的组队学习。本篇的学习…

业财一体化五步法 - 智慧园区

你有没有在公司遇到过这些情况: 业务部门和财务部门的销售数据和账务数据总是对不上;业务部门卖得飞快,财务部门却发现账户上的钱少了;决策者要靠数据制定策略,结果数据没一个是可用的。 说白了 ,这些问题其实就…

猫树

有的时候线段树还是太慢了(需要 \(\log\) 次合并得出答案)。使用猫树可以空间换时间:\(O(n\log n)\) 空间,\(O(1)\) 时间。但是猫树不支持修改。 应用条件:静态,卡时间死/合并复杂度很高。 【构建】 先建出一颗正…

spiffworkflow

spiffworkflow https://spiffworkflow.readthedocs.io/en/latest/index.html SpiffWorkflow is a library that provides a flexible workflow execution environment. SpiffWorkflow is the workflow library underly…

Rust 解析验证码(结合 Tesseract OCR)

环境准备 1.1 安装 Rust 如果尚未安装 Rust,可以使用官方推荐的 rustup 进行安装: curl --proto =https --tlsv1.2 -sSf https://sh.rustup.rs | sh 更多内容访问ttocr.com或联系1436423940 然后检查 Rust 版本: ru…

django-approval-workflow

django-approval-workflow https://github.com/Codxi-Co/django-approval-workflow A powerful, flexible, and reusable Django package for implementing dynamic multi-step approval workflows in your Django app…

Go 语言实现简单的文字识别(OCR)

随着人工智能技术的迅猛发展,文字识别(OCR,Optical Character Recognition)已经广泛应用于文档扫描、自动化数据输入等领域。在这篇文章中,我们将通过 Go 语言实现一个简单的文字识别程序,来提取图片中的文字。为…

『回忆录』高二上半期考试

上文:第一次月考。 现在是尚未出分的版本。 月回顾 从上次 1004 开始写,那天晚上也是开始疯狂回忆过去。 然后就是国庆强基三天自习一天。引流:国庆强基 中途 1006 那天晚上前两节课是生日会和中秋节。其中听歌识曲…

多项式牛顿迭代

【前置知识】泰勒展开。设 \(g\) 是一个光滑的函数,\(g(y)=\sum_{n\ge 0} \frac{g^{n}(y_0)}{n!}(y-y_0)^n\).多项式 exp。 给定多项式 \(a(x)\) 满足 \(a_0=0\),求 \(\exp a(x)\bmod x^n\)。 设 \(\exp a(x)=f(x)\)…

轮胎内喷涂优惠工具趋势分析报告

在轮胎制造与橡胶制品生产过程中,如何精准匹配工艺需求与材料性能,始终是行业采购决策中的核心难点。面对市面上琳琅满目的轮胎内喷涂、胶囊隔离剂、胶片隔离剂等产品,用户常因参数混乱、功能描述模糊或缺乏本地化适…

Vibe coding All In One

Vibe coding All In One Vibe coding is an artificial intelligence-assisted software development technique popularized by Andrej Karpathy in February 2025. It was named Collins Dictionarys Word of the Ye…

路径计数与反射容斥

【路径计数模型】 【卡特兰数】 组合意义:从 \((0,0)\) 走到 \((n,n)\),每次向右或者向上,不严格越过对角线的方案数。 它也和长度为 \(2n\) 的合法括号序列个数相等。各种问题都可以转化为卡特兰数。 回忆一下卡特…

多项式复合逆与拉格朗日反演

【定义】 对两多项式 \(f,g\),无常数项且一次项系数非 \(0\),有:\(f(g(x))=x\iff g(f(x))=x\)。(这个结论需要用到高深的群论知识,不会) 如果 \(f(g(x))=x\),称 \(f,g\) 互为复合逆。记 \(f^{-1}\) 为 \(f\) 的…

Day21浮动

1.浮动的基本使用 <!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-sc…

KEYDIY KD B12-3 3-Button Ford Flip Key Remote - 5pcs/lot (Replacement for Ford Vehicles)

## Problem: Key Replacements for Ford Vehicles – A Costly and Time-Consuming Hassle For European and American automotive repair shops and Ford vehicle owners, replacing lost or damaged keys can feel l…

Spring AI Alibaba 项目源码学习(七)-Agent、BaseAgent、ReactAgent 分析

Agent、BaseAgent、ReactAgent 分析 请关注微信公众号:阿呆-bot 概述 本文档分析 Spring AI Alibaba Agent Framework 中的核心 Agent 类层次结构,包括 Agent 基类、BaseAgent 抽象类和 ReactAgent 具体实现,重点分…

AtCoder Beginner Contest 432 ABCDEG 题目解析

A - Permute to Maximize 题意 给定三个个位数 \(A,B,C\)。 请找出将 \(A,B,C\) 按任意顺序排列并连接起来可以形成的所有三位数中的最大值。 思路 贪心可知,当数字长度一定时,可以优先让高位更大。因此对三个正整数…

fireworks

fireworks https://github.com/materialsproject/fireworks FireWorks stores, executes, and manages calculation workflows.Website (including documentation): https://materialsproject.github.io/fireworks/ He…