大模型多Agent实战:Agno与LangGraph全方位解析,带你掌握快速落地生产的核心技术!

今天还是聊聊生产级agent怎么搭这回事。

前面几期内容,我们聊了agent 常见的坑有哪些,memory怎么管理,还有一些rerank细节,今天从部署层面看看怎么选一个不错的agent框架。

现如今,针对复杂场景,多agent架构已经成为默认选择,相应的框架也已经数不胜数,但它们多多少少都存在两个问题,要么重demo,轻生产,稳定性有待提升;要么过于灵活,导致在需要快速交付、迭代的场景中,略显笨重。

针对这个问题,国产框架Agno 靠着高性能,以及快速落地生产,短短几个月,就拿下了30K+star。

那么它与LangGraph的区别是什么?怎么将其快速在生产环境部署?

本文将一一解答。

01

Agno是什么?与LangGraph的多智能体架构有什么区别?

Agno是专为生产环境设计的多智能体框架。它的架构分为两层:Agno框架层负责定义智能体的逻辑,AgentOS运行时层负责把这些逻辑变成可对外服务的HTTP接口。

其中,Agno框架层提供了三个核心抽象:Agent(智能体单元)、Team(多智能体协同)、Workflow(工作流编排)。开发者用纯Python代码定义智能体的能力、工具和知识源,框架负责LLM调用、工具执行、上下文管理。整个过程没有复杂的图编排,没有额外的DSL,都是直接的函数调用。

AgentOS运行时层则是生产部署的关键。它是异步优先、无状态的执行引擎,内置FastAPI集成,可以把本地开发的Agent直接转化为生产级HTTP服务。AgentOS提供了会话管理、流式响应、监控端点、水平扩展能力。开发者不需要自己写API层代码,也不需要考虑多线程和并发控制,AgentOS在底层已经处理好了这些问题。

整体的架构详情如下:

不难发现,与目前的主流多agent 框架LangGraph 相比,LangGraph 采用的是图状态机设计,将智能体系统建模为节点和边的组合,适合需要精确控制执行流程的场景。

Agno 则是独立的端到端解决方案,从框架层到运行时层提供完整的技术栈。开发者无需自行集成 API服务、会话管理和监控工具,AgentOS 已内置这些能力,强调的是快速从开发到生产的路径。

维度LangGraphAgno
编排方式显式图定义(节点+边)声明式 Workflow
状态管理自定义 State 类内置 Memory 系统
调试工具LangSmith(付费)AgentOS UI(开源)
运行时需自行集成独立 FastAPI 服务
部署复杂度需配置 LangServe开箱即用

整体来看,LangGraph 重灵活控制,Agno 重快速交付

在做选型时,我们可以根据项目阶段、技术栈和定制化需求权衡,必要时通过 POC 验证。

02

为什么选Milvus做知识层

确定了框架层的选型后,在记忆层,我们依然推荐选择Milvus,主要出于几个考虑。

Agno官方文档提供了Milvus的一级集成,agno.vectordb.milvus模块封装了连接管理、嵌入生成、批量写入等生产必需的功能。相比需要自己处理连接池和错误重试的方案,原生支持大幅降低了集成成本。

Milvus还能提供三种部署模式(Lite/Standalone/Distributed),可以从本地文件(./milvus.db)逐步升级到分布式集群。虽然切换过程需要数据迁移和配置调整,但代码层面的API接口保持一致,对于需要快速验证原型、然后逐步扩展到生产的团队来说比较实用。

我们先用单Agent演示基础流程,然后在生产环境的关键设计部分展示如何扩展到多智能体协同。这个demo构建一个知识库助手,并通过AgentOS提供HTTP服务。

03

快速开始:知识库助手的完整实现

1.部署 Milvus Standalone(Docker)

1.1下载部署文件

wget <https://github.com/Milvus-io/Milvus/releases/download/v2.5.12/Milvus-standalone-docker-compose.yml> -O docker-compose.yml

1.2启动Milvus服务

docker-compose up -d
docker-compose ps -a

2.核心实现

import os from pathlib import Path from agno.os import AgentOS from agno.agent import Agent from agno.models.openai import OpenAIChat from agno.knowledge.knowledge import Knowledge from agno.vectordb.milvus import Milvus from agno.knowledge.embedder.openai import OpenAIEmbedder from agno.db.sqlite import SqliteDb os.environ["OPENAI_API_KEY"] = "you-key-here" data_dir = Path("./data") data_dir.mkdir(exist_ok=True) knowledge_base = Knowledge( contents_db=SqliteDb( db_file=str(data_dir / "knowledge_contents.db"), knowledge_table="knowledge_contents", ), vector_db=Milvus( collection="agno_knowledge", uri="http://192.168.x.x:19530", embedder=OpenAIEmbedder(id="text-embedding-3-small"), ), ) # 创建Agent agent = Agent( name="Knowledge Assistant", model=OpenAIChat(id="gpt-4o"), instructions=[ "你是一个知识库助手,帮助用户查询和管理知识库的内容。", "使用中文回答问题。", "在回答问题之前,始终先搜索知识库。", "如果知识库为空,友好地提示用户上传文档。" ], knowledge=knowledge_base, search_knowledge=True, db=SqliteDb( db_file=str(data_dir / "agent.db"), session_table="agent_sessions", ), add_history_to_context=True, markdown=True, ) agent_os = AgentOS(agents=[agent]) app = agent_os.get_app() if __name__ == "__main__": print("\n🚀 启动服务...") print("📍 http://localhost:7777") print("💡 请在UI中上传文档到知识库\n") agent_os.serve(app="knowledge_agent:app", port=7777, reload=False)

2.1运行Agent

python knowledge_agent.py

3.连接AgentOS控制台

https://os.agno.com/

3.1注册登录

3.2选择连接AgentOS

3.3输入OS暴露的端口并自定义name

3.4进入知识库菜单添加文档并嵌入到Milvus

3.5测试效果

Milvus在这里的作用是提供高性能的语义检索能力。当知识库助手收到一个技术问题,它会通过search_knowledge工具把问题转换为向量,在Milvus中找到最相关的文档片段,然后基于这些片段生成回答。Milvus提供了三种部署模式,可以根据业务需求选择合适的方案,代码层面的接口保持一致。

上面的demo展示了基本用法,但如果要用于生产环境,还有几个架构层面的问题需要理解。

4.多智能体如何共享检索结果

Agno的Team模式支持share_member_interactions=True配置,这会把前序智能体的完整交互历史传递给后续智能体。如果第一个智能体从Milvus检索了某些数据,后面的智能体可以直接使用,不需要重复检索。这有两个效果:检索成本被摊销(一次查询,多次使用),以及检索质量被放大(如果第一次查询的结果不准确,错误会在整个团队中传播)。所以在多智能体系统中,Milvus的检索准确率比单智能体场景更重要。

补充Team代码示例:

from agno.team import Team analyst = Agent( name="数据分析师", model=OpenAIChat(id="gpt-4o"), knowledge=knowledge_base, search_knowledge=True, instructions=["分析数据并提取关键指标"] ) writer = Agent( name="报告撰写者", model=OpenAIChat(id="gpt-4o"), knowledge=knowledge_base, search_knowledge=True, instructions=["基于分析结果撰写报告"] ) team = Team( agents=[analyst, writer], share_member_interactions=True, # 共享知识检索结果 )

5.架构设计:Agno与Milvus的分层

Agno的AgentOS是无状态的,可以水平扩展多个实例。会话历史存储在关系型数据库中,但这些是流程状态(谁说了什么)。真正的领域知识(向量化的文档、报告)完全存储在Milvus中。这种架构解耦的好处是:Agno层压力大了,加实例;Milvus压力大了,扩查询节点。两者互不影响,可以独立优化资源配置。Agno需要CPU和内存(LLM推理),Milvus需要磁盘I/O和GPU(向量计算),硬件需求也完全不同。

6.Agent运行质量监控

Agno本身有持续评估能力,但引入Milvus后需要扩展监控范围。实际运行中,你需要关注检索准确率(返回的文档是不是真的相关)、答案忠实度(回答是基于检索内容还是LLM瞎编的),以及端到端延迟的拆解——把总耗时分解到查询嵌入、向量检索、上下文构建、LLM推理这几个阶段,才能定位具体瓶颈。

监控这些指标的目的是及时发现系统退化。比如你的Milvus数据量从100万涨到1000万,如果发现检索延迟明显变长,就该考虑调整索引参数或者升级部署模式了。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1124397.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Angular页面跳转01,深入浅出 Angular Router:RouterModule 配置与路由出口核心解析

在单页应用&#xff08;SPA&#xff09;开发中&#xff0c;路由是连接不同页面视图的核心桥梁。Angular 作为成熟的前端框架&#xff0c;提供了功能强大的angular/router模块&#xff0c;让开发者能优雅地实现页面导航、视图切换。本文将聚焦 Angular Router 的两大基础核心 —…

Token 烧钱如流水?Eino Skills 神器登场!让 Agent 学会「按需加载」,彻底告别上下文过载!

面对复杂的业务逻辑&#xff0c;AI 助手不该是把所有说明书都背下来的“书呆子”&#xff0c;而应该是懂得根据任务按需查阅手册的“专家”。 一、痛点&#xff1a;Agent 的“全量加载”困境 在构建复杂的 AI Agent 时&#xff0c;我们往往会给它塞入几十个 Tool。随之而来的问…

2026年网络安全行业新趋势:这5大方向,决定你明年的职业高度

2026年网络安全行业新趋势&#xff1a;这5大方向&#xff0c;决定你明年的职业高度 元旦跨年&#xff0c;既是时间的节点&#xff0c;也是职业规划的新起点。 随着数字化进程的加速&#xff0c;网络安全已成为守护数字经济的核心防线&#xff0c;行业人才缺口持续扩大。据权威…

信息安全前沿技术核心聚焦:最值得关注的五大方向与学习路线图

目前信息安全领域&#xff08;不限于技术层面&#xff09;有哪些前沿的研究方向&#xff0c;代表人物有哪些&#xff1f;有哪些新的研究成果&#xff1f;以及从哪些地方可以获得这些咨询&#xff1f; 我在做 system 方向的安全研究&#xff0c;最近发现其实中美两国都在 TEE (…

DeepSeek的mHC:一次精巧的工程突破,还是下一代AI的预告?

简介&#xff1a;2025年末&#xff0c;DeepSeek发布了一种叫mHC的新型神经网络架构&#xff0c;CEO亲自署名。这项技术解决了一个十年悬而未决的问题&#xff1a;如何让网络连接模式可学习而不导致训练崩溃。但论文只验证到270亿参数——在万亿参数的今天只是"中小规模&qu…

学长亲荐2026TOP10AI论文工具:本科生毕业论文写作全解析

学长亲荐2026TOP10AI论文工具&#xff1a;本科生毕业论文写作全解析 2026年AI论文工具测评&#xff1a;为何值得一看&#xff1f; 随着人工智能技术的不断进步&#xff0c;AI写作工具在学术领域的应用越来越广泛。对于本科生而言&#xff0c;撰写毕业论文不仅是学业的重要环节&…

2026 最新网络安全学习路线:从零基础到实战大神,结构清晰可落地

2026 最新网络安全学习路线&#xff1a;从零基础到实战大神&#xff0c;结构清晰可落地 网络安全作为数字时代的核心刚需&#xff0c;岗位需求持续爆发&#xff0c;但入门门槛高、知识体系杂&#xff0c;很多新手容易陷入 “盲目学工具、越学越迷茫” 的困境。 本文整理了一套…

一张知识地图看懂网络安全:常见技术深度解析与风险防范实战指南

伴随着互联网的发展&#xff0c;它已经成为我们生活中不可或缺的存在&#xff0c;无论是个人还是企业&#xff0c;都离不开互联网。正因为互联网得到了重视&#xff0c;网络安全问题也随之加剧&#xff0c;给我们的信息安全造成严重威胁&#xff0c;而想要有效规避这些风险&…

为什么说千万别学网络安全专业?

前言 很多人说千万别学网络安全专业的原因是因为网络安全专业学习的课程非常难。就业要求高。很多同学在大学开始接触网络空间安全专业时&#xff0c;才发现&#xff1a;对于自己来说&#xff0c;网络空间安全专业相关的课程学习难度有点高。 为什么说千万别学网络安全专业的原…

[Java 并发编程] ThreadLocal 原理

ThreadLocal 原理 1. ThreadLocal 基础使用 ​ ThreadLocal 被称为线程本地变量类&#xff0c;当多线程并发操作线程本地变量时&#xff0c;实际上每个线程操作的是其独立拥有的本地值&#xff0c;可以理解为每个线程分别独立维护自己的副本。这样就规避了线程安全问题&#xf…

网络安全(黑客方向)从入门到进阶:核心攻击手法剖析与防御实战指南

前言 什么是网络安全 网络安全可以基于攻击和防御视角来分类&#xff0c;我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术&#xff0c;而“蓝队”、“安全运营”、“安全运维”则研究防御技术。 如何成为一名黑客 很多朋友在学习安全方面都会半路转行&#xff0…

开发了一个免费的批量视频语音字幕识别工具,核心点是可批量自动处理识别任务

这个批量识别功能是免费的、无限制的、可批量使用的功能&#xff0c;可实现音频、视频文件语音识别转txt文本、srt字幕&#xff0c;主要是能批量执行识别任务&#xff0c;不用手动一个个去识别&#xff0c;这是与其他语音识别软件的最大的区别&#xff0c;而且可同时处理视频和…

炸裂汇总!2025收官硬核干货:380+页深度拆解RAG/Agent/MCP等9大核心,建议熬夜研读!

作为一名在AI一线滚打多年的老兵&#xff0c;我直白告诉你们&#xff1a;市面上真正能从底层原理直通生产落地的AI工程资料&#xff0c;凤毛麟角。今天这份《The AI Engineering Guidebook&#xff08;2025 Edition&#xff09;》&#xff0c;就是其中绝对的顶尖存在——384页硬…

Java小白求职者在互联网大厂面试:从Spring Boot到微服务的技术探索

场景&#xff1a;互联网大厂面试 在某个阳光明媚的早晨&#xff0c;小白程序员“超好吃”来到了知名互联网大厂进行他的Java开发工程师面试。面试官是一位经验丰富且略显严肃的高级工程师。 第一轮提问&#xff1a;Java与Spring Boot基础 面试官&#xff1a;欢迎你&#xff0c;…

重塑未来安全格局的五大前沿技术:从AI安全到零信任的深度解读

目前信息安全领域&#xff08;不限于技术层面&#xff09;有哪些前沿的研究方向&#xff0c;代表人物有哪些&#xff1f;有哪些新的研究成果&#xff1f;以及从哪些地方可以获得这些咨询&#xff1f; 我在做 system 方向的安全研究&#xff0c;最近发现其实中美两国都在 TEE (…

【2026年最新】有关漏洞挖掘的一些总结,新手小白网络安全入门必看的经验教训!

时隔一年多以后再次看本文&#xff0c;依然给我一些启发&#xff0c;尤其是经过一定量的实践以后&#xff0c;发现信息收集真乃漏洞挖掘(渗透测试)的本质&#xff0c;这里再次回顾一下本文&#xff0c;尤其是里面如何评估一个项目(目标)的难度&#xff0c;值得学习与借鉴&#…

边缘模型增量微调实战

&#x1f493; 博客主页&#xff1a;借口的CSDN主页 ⏩ 文章专栏&#xff1a;《热点资讯》 边缘模型增量微调实战&#xff1a;从理论到边缘设备的高效部署目录边缘模型增量微调实战&#xff1a;从理论到边缘设备的高效部署 引言&#xff1a;边缘智能的必然选择 一、现在时&…

新中地学员转行学GIS开发原因盘点①

你有没有过那种时刻&#xff1a;明明已经很努力了&#xff0c;结果却不尽如人意&#xff1f; 比如考研失利、求职被拒&#xff0c;甚至开始怀疑自己选的专业到底适不适合…… 其实很多人都经历过这种“卡住”的瞬间&#xff0c;但有些人没有停下&#xff0c;而是悄悄换了赛道…

构建企业级安全防线:盘点网络安全防范的核心技术及其实战应用体系

伴随着互联网的发展&#xff0c;它已经成为我们生活中不可或缺的存在&#xff0c;无论是个人还是企业&#xff0c;都离不开互联网。正因为互联网得到了重视&#xff0c;网络安全问题也随之加剧&#xff0c;给我们的信息安全造成严重威胁&#xff0c;而想要有效规避这些风险&…

FileImgSwap 文图变文件藏到图片是一款可以把文件与 PNG 图像进行互转的工具

大家好&#xff0c;我是大飞哥。平时传敏感文件、存私密资料总怕泄露&#xff0c;或者想把文件藏起来不显眼&#xff0c;所以我搞了这款“FileImgSwap文图变文件藏到图片工具”&#xff0c;能把任意文件藏进PNG图里&#xff0c;还能还原提取&#xff0c;加了加密功能&#xff0…