RAG Agent记忆功能完全指南:3种方法解决长对话上下文丢失问题

本文介绍了为RAG Agent添加记忆功能的实现方法,重点讲解了如何通过消息列表实现短期记忆,以及解决长对话导致的上下文窗口限制问题,包括截断、删除和总结消息三种方法,并介绍了如何自定义AgentState来增强记忆能力,帮助开发者构建更智能的对话系统。


但是这个 Agent 仅仅能完成一次用户查询,它无法记住先去与用户的交互。

对于 Agent 而言,记忆(memory)至关重要,因为它使它们能够记住之前的交互内容、从反馈中学习,并适应用户的偏好。随着 Agent 处理的任务日益复杂、涉及的用户交互越来越多,这种能力对提升效率和用户满意度变得尤为关键。

短期记忆(short-term memory)使我们的应用程序能够在单个对话线程(thread)中记住之前的交互内容。

聊天模型通过消息接收上下文,这些消息包括指令(系统消息)和输入(用户消息)。在聊天应用中,消息通常在用户输入和模型回复之间交替出现,所以我们可以通过消息列表来实现短期记忆。

但是随着用户交互的不断增加,这个消息列表会随时间不断增长。长对话对当今的 LLM 带来了挑战:

  • 完整的对话历史可能无法容纳在模型的上下文窗口内,从而导致上下文丢失或错误。
  • 即使你的模型支持足够长的上下文长度,大多数 LLM 在处理长上下文时的表现仍然不佳。它们容易被陈旧或离题的内容“分散注意力”,同时还会面临响应速度变慢和成本增加的问题。

在这个视频中我介绍了:

  • 如何通过消息列表给智能体应用加上短期记忆功能;
  • 为了应对消息列表过长导致超过 LLM 上下文窗口限制的方法:
  • Trim Messages:在调用 LLM 之前移除前 N 条或后 N 条消息。

  • Delete messages:删除指定的消息

  • Summarize messages:将前面的消息内容总结以缩短消息列表长度

  • 自定义 AgentState:加上自己想要智能体记住的东西

如何系统的学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

01.大模型风口已至:月薪30K+的AI岗正在批量诞生

2025年大模型应用呈现爆发式增长,根据工信部最新数据:

国内大模型相关岗位缺口达47万

初级工程师平均薪资28K(数据来源:BOSS直聘报告)

70%企业存在"能用模型不会调优"的痛点

真实案例:某二本机械专业学员,通过4个月系统学习,成功拿到某AI医疗公司大模型优化岗offer,薪资直接翻3倍!

02.大模型 AI 学习和面试资料

1️⃣ 提示词工程:把ChatGPT从玩具变成生产工具
2️⃣ RAG系统:让大模型精准输出行业知识
3️⃣ 智能体开发:用AutoGPT打造24小时数字员工

📦熬了三个大夜整理的《AI进化工具包》送你:
✔️ 大厂内部LLM落地手册(含58个真实案例)
✔️ 提示词设计模板库(覆盖12大应用场景)
✔️ 私藏学习路径图(0基础到项目实战仅需90天)





第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1131421.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ehercat代码解析中文摘录<8>

12 工具从站协议栈代码工具允许根据用户特定要求和设置创建新的从站文件。从站文件列表:C源代码文件源代码文档(可选)设备描述(ESI)(可选)支持的操作系统:Windows XP, Vista, 7 (32位…

太流批了,老牌软件,数据对比神器

在日常工作中打工人有的时候需要整理表格和数据,需要在两个文档之间进行对比,看一看文件做了哪些修改。但是,如果用眼进行一行行对比的话就会很麻烦,而且效率会很慢。今天给大家推荐一款好用的数据对比软件,有需要的小…

收藏!裸辞转型AI大模型,我的完整攻略与经验分享

本文分享裸辞转型AI大模型的成功经历,包括转行动机、系统学习准备和面试经验。强调深入理解底层原理、做好经济心态准备、针对性优化简历和保持良好心态的重要性,为想进入AI领域的人提供实用参考。今年很重要的一个经历就是裸辞然后顺利转行到了AI大模型…

个性化旅游行程规划系统-计算机毕业设计源码+LW文档

摘要 随着人们生活水平的提高和旅游需求的日益增长,旅游已成为人们放松身心、拓展视野的重要方式。然而,在旅游过程中,行程规划、费用管理、信息分享等方面的问题也逐渐凸显。传统的旅游管理方式存在效率低下、信息不及时等问题,难…

北大团队创新方案:CKDA框架解决跨模态行人重识别的持续学习痛点

北大团队提出CKDA框架,解决跨模态行人重识别中的持续学习灾难性遗忘问题。该框架通过跨模态通用提示生成器提取共享特征,单模态专用提示生成器保留模态特有信息,以及跨模态知识对齐引擎防止遗忘。实验表明,该框架在四个主流数据集…

2026年--Lc333-328. 奇偶链表(链表)--java版

1.题目2.思路 原地重排链表: odd.nexteven.next:跳过偶数,把下一个奇数连起来 even.nextodd.next:跳过奇数,把下一个偶数连起来 最后把奇数链尾接回 evenHead 3.代码实现 /*** Definition for singly-linked list.* pu…

AI会取代前端吗?2026年前端发展路线图,建议收藏学习

AI无法完全取代前端开发,因缺乏人类的逻辑、沟通和创新能力。前端工作不仅是写代码,还包括与多团队协作。当前前端行业竞争激烈,要求不断提高,但仍有发展空间。前端工程师可考虑向管理、架构师或讲师方向发展,或继续深…

牛批了,桌牌台签神器,批量制作

在日常开会的时候,往往需要制作桌牌台签,排版和格式校对等问题也是非常头疼的。今天给大家推荐一款桌牌台签打印神器,能够快速高效的制作各种类型的桌牌,非常方便,有需要的小伙伴可以下载收藏。 桌牌台签打印 一键制作…

MySQL 数据库连接数查询、配置

MySQL 数据库的连接数是指同时与 MySQL 数据库建立的客户端连接数量。连接数与 MySQL 的性能密切相关,需要根据实际需求和服务器资源进行合理配置和优化。 1. 查看连接数1.1. 查看当前会话连接数 SHOW STATUS LIKE ‘Threads_connected’; 1.2. 查看历史最大连接数 …

MySQL5.7.44-winx64版本Windows Server下载安装教程图解

1、下载MySQL5.7.44安装包,MySQL :: Download MySQL Community Server (Archived Versions) 2、解压到D:mysql-5.7.44-winx64 目录下(这个可以根据需要自行调整),解压后在根目录下创建my.ini和data文件夹。 [mysql] # 设置 my…

AI Agent记忆系统大揭秘:从“失忆“到“长记性“的进化之路(附代码实战)

本文详解AI Agent的记忆系统,分短期记忆与长期记忆两部分。短期记忆介绍3种优化策略(缩减法、卸载法、隔离法)及框架代码实现;长期记忆解析信息提取、向量存储、关系推理等技术,并提供Mem0/ReMe集成代码。展望记忆即服务、精细化管理、多模态…

MySQL 数据库基础

目录 什么是数据库 数据库分类 关系型数据库 非关系型数据库 SQL子语言 MySQL MySQL 存储数据的组织方式 数据库操作 显示当前数据库 创建数据库 使用数据库 删除数据库 什么是数据库 数据库 是一个用于存储、管理和检索数据的系统,可以组织和保存大量…

基于python大数据的协同过滤音乐推荐系统

博主介绍:java高级开发,从事互联网行业六年,熟悉各种主流语言,精通java、python、php、爬虫、web开发,已经做了多年的设计程序开发,开发过上千套设计程序,没有什么华丽的语言,只有实…

K8S网络和基本命令 【 K8S (二)】

目录 一、Flannel 的核心基础(通信前的准备) 二、Flannel 的三种核心通信模式 场景 1:同节点内 Pod 通信(无需 Flannel 隧道) 场景 2:跨节点 Pod 通信(Flannel 核心) 模式 1&…

MySQL 的 INSERT(插入数据)详解

MySQL 的 INSERT(插入数据)详解 在 MySQL 中,INSERT 语句用于向数据库表中添加新的记录。INSERT 语句非常灵活,支持多种语法形式,可以根据具体需求选择合适的用法。以下是 INSERT 语句的详细语法和使用示例。 1. 插入单…

MySQL 篇 - Java 连接 MySQL 数据库并实现数据交互

在现代应用中,数据库是不可或缺的一部分。Java 作为一种广泛使用的编程语言,提供了丰富的 API 来与各种数据库进行交互。本文将详细介绍如何在 Java 中连接 MySQL 数据库,并实现基本的数据交互功能。 一、环境准备 1.1 安装 MySQL 首先&am…

基于BS架构的积分制零食自选平台-计算机毕业设计源码+LW文档

摘要 本文介绍了一个基于BS(Browser/Server,浏览器/服务器)架构的积分制零食自选平台的设计与实现。该平台旨在为用户提供一个便捷、个性化的零食购物体验,并通过积分制度激励用户的消费行为。平台的前端采用HTML、CSS和JavaScrip…

MySQL 查看有哪些表

在 MySQL 数据库中,要查看某个数据库中有哪些表,你可以使用以下几种方法: 方法一:使用 SHOW TABLES 命令连接到 MySQL 服务器: 首先,你需要使用 MySQL 客户端工具(如 mysql 命令行工具、MySQL W…

【收藏级】揭秘Claude Research:构建高性能多智能体AI系统的实战经验

Anthropic介绍了Claude Research功能的多智能体系统架构,由主导智能体协调多个并行子智能体完成复杂研究任务。该系统在开放式问题处理上表现优异,性能较单智能体提升90.2%。文章详细阐述了系统架构、执行流程、提示工程原则、评测方法及生产环境中的挑战…

基于python深度学习的面部表情识别系统

博主介绍:java高级开发,从事互联网行业六年,熟悉各种主流语言,精通java、python、php、爬虫、web开发,已经做了多年的设计程序开发,开发过上千套设计程序,没有什么华丽的语言,只有实…