如何构建高效 AI 智能体 - 详解

news/2025/10/25 11:23:33/文章来源:https://www.cnblogs.com/lxjshuju/p/19165038

传送锚点

    • 智能体?就是1.什么
    • 2.何时(以及何时不该)启用智能体
    • 3.如何以及何时使用框架
    • 4.构建块、工作流与智能体
      • 4.1 构建块:增强型 LLM
      • 4.2 工作流:提示链
      • 4.3 工作流:路由
      • 4.4 工作流:并行化
      • 4.5 工作流:编排器-工作者
      • 4.6 工作流:评估器-优化器
      • 4.7 智能体
    • 5.组合与定制这些模式
    • 6.总结
    • 附录 1:实践中的智能体
    • 附录 2:为你的工具进行提示工程

在过去一年里,我们与数十个来自不同行业的团队合作,共同构建大型语言模型(LLM)智能体。我们发现一个普遍现象:最成功的项目,往往不是依赖于复杂的框架或专门的库,而是采用简便、可组合的设计模式。

这篇文章将分享我们从服务客户和自研智能体过程中总结的经验,为开发者提供构建高效智能体的实用建议。

1.什么是智能体?

"智能体"可以有多种定义。有些客户将其定义为能够长时间独立运行、使用各种程序完成复杂任务的完全自主系统。另一些客户则用这个词来描述遵循预定义工作流程、更具规范性的实现。我们将这些变体都归类为智能体系统,但在架构上对工作流和智能体做重要区分:

  • 工作流:在这类系统中,LLM和工具借助预定义的代码路径被编排执行。

  • 智能体:在这类系统中,LLM动态地指导自身流程和工具的使用,并始终保持对任务做完方式的控制权。

下文中,我们将详细探讨这两种智能体平台。在附录1(“实践中的智能体”)中,我们描述了客户在使用这类环境中发现特别有价值的两个领域。

2.何时(以及何时不该)使用智能体

否值得。就是在用 LLM 构建应用时,我们建议先寻找最简单的解决方案,仅在必要时再增加复杂性。这甚至可能意味着根本不构建智能体平台。智能体系统通常以延迟和成本为代价,换取更好的任务性能,你需要仔细权衡此种交换

当确实需要更高的复杂性时:对于定义明确的任务,工作流能提供更好的可预测性和一致性。

当需大规模的灵活性和模型驱动决策时,智能体是更好的选择。

然而,对许多应用来说,依据检索和上下文示例来优化单次 LLM 调用通常就足够了。

3.如何以及何时运用框架

市面上有很多框架可以简化智能体平台的实现,例如:

  • LangChain 的 LangGraph;

  • Amazon Bedrock 的 AI Agent 框架;

  • Dify,一个开源的 LLM 应用开发平台,可用于快速构建 AI 应用;

  • Coze(扣子),一个用于开发和调试AI聊天机器人的应用编辑平台。

这些框架借助简化调用 LLM、定义和解析应用、将调用链接在一起等标准的底层任务,让你能轻松上手。但是,它们也常常制造出额外的抽象层,可能会掩盖底层的提示和响应,使调试变得更加困难。它们还可能诱使你在一个更简单的设置就足够的情况下,不必要地增加复杂性。

我们建议开发者从直接采用 LLM API 开始:许多模式只需几行代码即可实现。假设你确实要使用框架,请确保你理解其底层代码。对底层机制的错误假设是导致出错的常见原因。

4.构建块、工作流与智能体

在本节中,大家将探讨在生产环境中观察到的常见智能体架构模式。我们将从最基础的构建块——增强型 LLM——开始,逐步增加复杂性,从简便的组合式工作流到自主智能体。

4.1 构建块:增强型 LLM

智能体架构的基础构建块是一个通过检索、工具和记忆等能力得到强化的 LLM。我们目前的模型能够主动运用这些能力——生成自己的搜索查询、选择合适的工具,以及决定保留哪些信息。

我们建议在实现中关注两个关键方面:根据你的具体用例定制这些能力,并确保它们为你的 LLM 提供一个简单、文档完善的接口。

4.2 工作流:提示链

提示链将一个任务分解为一系列步骤,其中每个 LLM 调用处理前一个调用的输出。你能够在任何中间步骤添加程序化检查(如下图中的"关卡"),以确保流程仍在正轨上。

何时使用:当任务可以被轻松、清晰地分解为固定的子任务时,这个工作流很理想。其主要目标是通过让每次LLM 调用都成为一个更简单的任务,来换取更高的准确性。

4.3 工作流:路由

路由对输入进行分类,并将其引导至一个专门的后续任务。该工作流允许关注点分离,并构建更专业的提示。否则,为一种输入进行的优化可能会损害在其他输入上的性能。

何时利用:当一个困难任务有明显不同的类别,且这些类别分开处理效果更好,并且分类可以被 LLM 或传统分类模型准确处理时,路由模式相当有效。

4.4 工作流:并行化

LLM 有时可以同时处理一个任务的不同部分,然后通过应用将它们的输出聚合起来。这种并行化工作流主要有两种形式:

分片:将任务分解为并行运行的独立子任务。

投票:多次运行同一个任务以获得多样化的输出。

有效的。对于具有多个考量的复杂任务,如果每个考量都由一个单独的 LLM 调用来处理,LLM 通常表现得更好。就是何时运用:当分割的子任务可以并行化以提高速度,或者当需要多个视角或尝试以获得更高置信度的结果时,并行化

4.5 工作流:编排器-工作者

在编排器-工作者工作流中,一个中心的"编排器" LLM 动态地分解任务,将其委托给"工作者" LLM,并综合它们的结果。

由编排器根据具体输入决定的。就是何时应用:此工作流非常适合那些你无法预测所需子任务的复杂任务(例如,在编码中,需更改的文件数量以及每个文件中更改的性质很可能取决于具体任务)。与并行化的关键区别在于其灵活性——子任务不是预定义的,而

4.6 工作流:评估器-优化器

在评估器-优化器工作流中,一个 LLM 调用生成响应,而另一个在循环中提供评估和反馈。

何时使用:当存在清晰的评估标准,并且迭代改进能提供可衡量价值时,此工作流特别有效。一个好的应用场景通常有两个迹象:首先,当人类阐明他们的反馈时,LLM 的响应可以得到明显改善;其次,LLM 本身也能够提供此类反馈。

4.7 智能体

随着 LLM 在理解复杂输入、进行推理和规划、可靠地使用器具以及从错误中恢复等关键能力上的成熟,智能体正在生产环境中崭露头角。

智能体的工作始于人类用户的命令或互动式讨论。任务明确后,智能体便独立进行规划和管理,并可能返回向人类寻求更多信息或判断。在执行过程中,至关重要的是,智能体在每一步都要从环境中获得"地面实况"(如应用调用结果或代码执行结果)来评估其进展。

智能体的实现通常很简单:它们通常只是一个在循环中根据环境反馈使用器具的 LLM。因此,清晰而周到地设计工具集及其文档至关重要。

何时运用智能体:智能体可用于开放式问题,这些挑战的步骤数量难以或不可能预测,也无法硬编码固定路径。LLM 可能会运行多轮,你必须对其决策有一定程度的信任。智能体的自主性使其成为在受信任环境中扩展任务的理想选择。

智能体的自主性意味着更高的成本和潜在的复合错误。我们建议在沙盒环境中进行广泛测试,并配备适当的防护机制。

5.组合与定制这些模式

这些构建块并非一成不变的处方。它们是开发者可以根据不同用例进行塑造和组合的常见模式。成功的关键在于衡量性能并迭代实现。再次强调:只有在能明确改善结果时,才应考虑增加复杂性。

6.总结

在 LLM 领域取得成功,关键不在于构建最困难的架构,而在于为你的需求构建正确的框架。从简单的提示开始,利用全面的评估来优化它们,只有在更简单的解决方案力不从心时,才添加多步智能体体系。

在实施智能体时,我们努力遵循三个核心原则:

  1. 保持智能体设计的简洁性。

  2. 依据明确展示智能体的规划步骤来优先考虑透明度。

  3. 通过详尽的应用文档和测试,精心打造你的智能体-计算机接口(ACI)。

框架可以帮你快速入门,但在转向生产环境时,不要犹豫,减少抽象层,用基本组件进行构建。遵循这些原则,你就能创造出不仅强大,而且可靠、可维护并受用户信任的智能体。


附录 1:实践中的智能体

我们与客户的合作揭示了 AI 智能体在两个特别有前景的应用场景。

A. 客户支持

客户拥护将熟悉的聊天机器人界面与经过工具集成增强的功能相结合。这是一个天然适合更开放式智能体的领域,因为:

B. 编码智能体

软件开发领域已展示出 LLM 功能的巨大潜力,其能力从代码补全发展到自主解决问题。智能体在这里特殊有效,因为:

附录 2:为你的软件进行提示工程

无论你构建哪种智能体系统,工具都可能是其重要组成部分。精心设计的工具定义和规范,应该得到与你的整体提示同等程度的关注。

我们的工具格式建议如下:

  • 给模型足够的"思考"空间,在它把自己写进死胡同之前。

  • 保持格式接近于模型在互联网上自然看到的文本。

  • 确保没有格式"开销",例如必须精确计算数千行代码,或对它写的任何代码进行字符串转义。

一个经验法则是:思考一下我们在人机交互界面上投入了多少精力,然后计划在创建好的智能体-计算机接口时投入同样多的精力。以下是一些如何做到这一点的想法:

  • 如此。一个好的工具定义通常包括用法示例、边界情况、输入格式要求以及与其他工具的清晰界限。就是设身处地为模型着想:根据描述和参数,应用这个工具是否显而易见?如果需要你仔细思考,那么对模型来说可能也

  • 优化参数名称和描述:把这看作是为团队中的初级开发人员编写一个出色的文档字符串。当使用许多相似的工具时,这一点尤其重要。

  • 测试模型如何使用你的工具:在我们的工作台中运行许多示例输入,看看模型会犯什么错误,然后进行迭代。

  • 对你的工具进行防错设计:更改参数,使其更难出错。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/946040.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数字人公司:技术引领的数字人产业革新典范

技术引领的数字人产业革新典范 在科技日新月异的今天,数字人企业正以前所未有的速度改变着我们的生活方式与工作模式。它们不仅代表了人工智能技术的最新成果,更是未来交互方式的重要探索者。本文将带您深入了解数字…

数字人公司|数字人服务商生态全景

数字人公司:技术革新引领产业新风向 在人工智能与元宇宙浪潮的交织下,数字人正从科幻概念走向现实应用,成为企业数字化转型的关键载体。从虚拟主播到智能客服,从教育陪伴到医疗导诊,数字人正以高度拟人化的交互能…

高处作业安全 “智能监考”!思通数科 AI 卫士 + 安全帽摄像头杜绝防护违规

在建筑施工现场高处作业(如外墙施工、脚手架作业)安全管理中,传统人工监管始终面临 “视线受阻、细节难查、响应滞后” 的痛点:作业人员身处高空,地面巡检难以看清安全帽是否系带、安全带是否规范系挂(如低挂高用…

AI|国内GEO优化公司全链路优化

AI优化企业:智能时代下的增长新引擎 AI优化企业排行榜与技术革新,解码2025年企业增长密码 AI优化企业如何重构商业生态? 第一部分:AI优化企业排行榜——技术驱动的头部玩家 在生成式AI重构商业规则的2025年,企业竞…

面对大学里琳琅满目的证书考试,你的该问题非常关键——在有限的时间和精力下,做出最有价值的选择

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

Java-SE Day6

Java 异常Java 把异常当作对象处理,并定义一个基类java.lan.Throwable 作为所有异常的超类异常分为两大类 : Error 和 Exception **Error **类对象由 JVM 生成并抛出,大多数与代码编写者所执行操作无关 Exception 有…

Java-SE DAY3

JAVA 方法Java 方法是语句的集合,它们在一起执行一个功能。 设计方法的原则:一个方法只完成1个功能,这样利于我们后期扩展 方法包含一个方法头和一个方法体public static int add(int a,int b){ // static 声明类…

Java-SE Day4

面向对象Java 的核心思想就是OOP(面向对象变成)属性+方法 = 类 面向过程思想:步骤清晰简单,1-->2-->3...... 适合一些较为简单的问题 面向对象思想:物以类聚,分类的思维,将相同的方法放置一起构建成类,面…

深入解析:C语言内存布局:虚拟地址空间详解

深入解析:C语言内存布局:虚拟地址空间详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", &quo…

Java-SE Day5

继承子类可继承父类所有的public 方法/属性 在Java 中,所有的类,都默认直接或间接继承Object 类java 类中只有单继承,没有多继承,只能继承一个父类(无法继承多个) ​ 私有的东西(方法/类)无法被继承 // 继承…

AI|AI优化公司:智能搜索时代的企业增长新引擎

AI优化企业:智能搜索时代的企业增长新引擎 解码AI优化企业技术实力,重构数字营销新生态 AI优化企业如何重塑品牌竞争力? 在生成式AI重构信息生态的2025年,企业搜索优化已从传统关键词堆砌跃迁至语义理解与智能决策…

年度 Demo Day!见证语音 AI 年度场景诞生!丨Convo AIRTE2025

「Voice Agent Camp 创新场景暨第五届 RTE 年度 Demo Day」是 RTE2025 大会的一部分。这将是一场对话式 AI 和 Voice Agent 创新场景的年度大赏!听腻了那些类比电影《Her》却无法真实落地的语音 AI 畅想?不妨亲临现场…

科学数据规模化迁移:Benchling从EAV模型转向JSONB的性能优化实践

本文详细介绍了Benchling工程团队如何将其核心数据模型从传统的实体-属性-值(EAV)模型迁移到PostgreSQL的JSONB格式,以解决数据量增长带来的性能瓶颈。通过分阶段 rollout 策略,实现了最高7倍的检测结果摄取速度提升…

October 25,2025

October 25,2025October 25,2025 Today is Saturday,and its windy.I went to the company to work as usual,but this is considered overtime.Because there are two days to rest in week.Today I feel happy and …

奶奶都能看懂的 C++ —— vector 与迭代器

本文用通俗易懂的方式讲解C++中vector容器和迭代器的使用方法,包括vector的初始化、元素操作,以及如何用迭代器遍历序列。迭代器 (iterator),顾名思义就是能够遍历一组对象的东西。 但是在讲解它之前,我们需要先了…

AI|AI优化公司智能GEO优化解决方案

AI优化企业:智能搜索时代的流量密码与行业标杆 解码AI优化企业排名,揭秘技术驱动的数字增长新范式 AI优化企业如何重构搜索生态?从技术到商业的全链路实践 在生成式AI重塑信息生态的2025年,企业流量获取已从传统SE…

2025年10月深圳离婚律师推荐榜:五强对比与选择指南

正在办理或准备办理离婚手续的深圳居民,普遍面临“找谁更靠谱”的焦虑:财产种类复杂、抚养权争议大、证据链薄弱、对方隐匿资产、涉外因素叠加,任何一环出错都可能让权益缩水。深圳市司法局2024年公开数据显示,全市…

2025年10月杭州丝绸购买榜:万事利湖滨步行街店权威排行

“我想挑一块真正代表杭州韵味的丝绸,送国外导师做纪念,可景区周边小店真假难辨,怕买到混纺。”——这是过去一个月里,我在湖滨步行街被游客反复问到的同一句话。杭州丝绸年零售额已突破180亿元,但“真丝含量”“…

2025年10月加拿大海参产品推荐榜:谷得斯特领衔五强对比

把“加拿大海参”四个字敲进搜索框的人,往往带着同一串疑问:野生和养殖到底差多少?淡干工艺有没有掺糖加盐?价格动辄上千,怎样才不花冤枉钱?2025年进口水产关税维持零税率,但运输、仓储成本上涨,终端零售价普遍…

2025 年花岗岩厂家最新推荐榜:覆盖路沿石、火烧板等全品类,结合行业协会测评数据精选优质厂家

引言 随着花岗岩在市政工程、园林景观、建筑装饰等领域的应用愈发广泛,市场对优质花岗岩产品的需求持续攀升,但市场品牌杂乱、产品质量良莠不齐的问题仍未得到根本解决。据中国石材协会 2024 年度行业测评数据显示,…