让Agent画思维导图稳固长期记忆:新框架实现稳定长期学习,准确率提升38%

传统RAG在“长期记忆管理”和“持续学习承载能力”两个层面,正在同时暴露出结构性瓶颈。

思维导图曾被证明可以帮助学习障碍者快速提升成绩,那么当前已经可堪一用的智能体系统如果引入类似工具是否可以帮助改善长期学习记忆能力呢?有研究团队做出了探索性尝试。

在长上下文和Agent应用不断落地的过程中,越来越多研究者开始意识到,如果Agent需要像人一样持续学习、不断积累经验并形成稳定的认知结构,仅依赖传统RAG的“检索式记忆”已经难以支撑长期演化。

传统RAG在“长期记忆管理”和“持续学习承载能力”两个层面,正在同时暴露出结构性瓶颈。

向量数据库擅长相似度检索,却难以表达时间顺序、因果关系和状态演化;随着历史数据规模持续增长,系统成本不断上升,也更容易出现记忆漂移、逻辑断裂以及隐性的知识遗忘。

当Agent的交互跨度从“单轮问答”扩展到“跨月甚至跨年的持续运行”时,这种碎片化记忆结构会直接限制其学习能力与行为稳定性。

近期,中国电信人工智能研究院(TeleAI)研究团队提出了一种基于DAG(有向无环图)的通用记忆框架——TeleMem,从“数据结构层”重新设计Agent的记忆组织方式,使记忆不仅可检索,而且可持续累积、可回溯、可演化。

该架构通过统一表征与索引、离线与在线协同更新,以及基于闭包的上下文检索机制,构建了一套结构稳定、面向规模化、能够支撑长期持续学习的记忆系统。

此项成果由中国电信集团CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授指导,已在GitHub开源。

为什么传统RAG难以支撑长期记忆与持续学习?

当前主流RAG架构通常以向量数据库为核心:

  • 每一段记忆被编码为独立向量;
  • 检索阶段依赖Top-K相似度匹配;
  • 上下文拼接交由大模型自行理解。

这种范式在短文本问答场景表现良好,但在长期交互和Agent场景中逐渐暴露出明显问题:

1. 缺乏时间与因果结构

向量只能表达语义相似度,无法描述事件先后关系、状态依赖和决策演化路径。

这使系统难以形成稳定的学习轨迹,无法区分“新知识是补充、修正还是替代旧认知”。

2. 上下文碎片化严重

检索返回的是离散片段,模型需要自行补全逻辑链条,容易产生幻觉与不一致推理。

在持续学习场景下,这种碎片化上下文会导致认知漂移和策略不稳定。

3. 索引随规模恶化

随着历史数据增长,写入成本、索引漂移和存储冗余不断累积,系统很难在长期运行中保持稳定学习能力。

本质上,RAG面临的并不是检索精度问题,而是其记忆数据结构难以承载跨时间的知识积累、状态演化与因果依赖,因此难以支持真正意义上的持续学习。

TeleMem:把“记忆”从向量集合升级为可演化的时序因果图

TeleMem的核心设计,是将所有历史记忆统一组织为一张“有向无环图”(DAG),把“记忆存储”升级为“可演化的认知结构”,使Agent的每一次交互结果都成为可被持续累积、回溯和修正的学习状态,而不再只是一次孤立的向量写入。

在这张图里:

节点(Node)

表示一段已经被语义理解并稳定固化的记忆状态,包含内容语义、向量表征和时间信息。每个节点对应一次对话状态、一次关键事件,或一次阶段性的认知更新结果。

依赖边(Edge)

表示节点之间显式的语义与因果依赖关系,即“当前认知由哪些历史状态条件转化而来”。边为有向结构,并严格满足时间约束(只能从更早节点指向更新节点),从而保证语义单调演化,避免循环依赖与认知回滚。整体图保持为最小因果骨架:仅保留不可约依赖,若两节点之间已存在间接可达路径,则对应的直连边会被剪除,以消除传递冗余并维持依赖结构的最简性。

路径(Thread)

多条依赖边串联起来,形成可追溯的记忆演化链,不仅用于描述话题、状态或角色在时间维度上的连续演进,也天然刻画了Agent的认知更新与持续学习轨迹。

为了保证整张图的连通性,系统还引入虚拟起点节点,用于挂载没有显式前置依赖的学习起点,避免孤立认知片段的产生。

换句话说,系统存储的不再是彼此孤立的向量片段,而是一张具备时间顺序、因果约束和可回溯结构的“认知记忆网络”,能够支持长期稳定的知识积累与演化。

统一的语义节点:将经验压缩为可复用的学习状态

在TeleMem中,节点不再只是一个embedding,而是承载多类型语义表征的复合结构,覆盖用户状态、交互事件和环境对象等多个语义层面:

用户与角色记忆:刻画用户画像、长期偏好以及角色状态随时间的演化;

事件与情境记忆:对对话片段、视觉内容等交互过程进行语义摘要,形成稳定的事件级学习表示;

对象与环境状态记忆:记录物理对象或环境属性的结构化状态变化。

这些节点保存的是“被模型理解并稳定固化后的语义状态”,可以视为持续学习过程中的阶段性认知结果,而非原始文本、像素或传感数据。这种抽象显著降低了存储与索引成本,同时减少噪声积累,使长期知识能够稳定复用并支持跨任务迁移。

因果连边与DAG约束:为持续学习提供结构稳定性

节点之间通过显式依赖边连接,每条边同时表达三类约束:

时间顺序约束:每个节点只能依赖时间上早于自身的父节点,从结构上避免循环学习与状态回滚;

语义依赖约束:明确刻画当前认知形成所依赖的上下文信息;

逻辑约束:依赖图维持为最小因果骨架,仅保留不可约依赖关系;若两节点之间已存在可达路径,则对应直连边会被剪除,以避免冗余、冲突或被其他路径覆盖的依赖。

DAG结构天然避免循环依赖,使历史认知可以稳定回溯和并行遍历,从结构层面降低灾难性遗忘与隐性知识覆盖的风险,也为后续的增量构图、长期维护和闭包检索提供可靠基础。

在这种结构下,Agent的学习不再是无序追加,而是沿着可解释、可约束的认知轨迹持续演化。

表征与索引的双层协同更新机制

TeleMem将记忆系统拆分为两个协同演化的层次:

表征层(Representation Layer):负责语义内容的抽象、压缩与状态演化,如用户画像、事件摘要和多模态语义表示。

索引层(Index / Graph Layer):负责维护节点之间的时间约束、因果依赖与可检索拓扑结构。

核心挑战在于:表征持续变化,而索引必须同步反映这些变化,同时保持可扩展性与一致性。为此,TeleMem设计了Offline Batch与Online Stream两条更新路径,覆盖不同时间尺度下的更新需求。

Offline Batch:全量表征整合与离线并行构图

1.表征层更新:离线并行聚类决策

在TeleMem中,表征层并不是简单累积对话内容,而是通过一套高度并行的批处理流水线,将原始交互持续压缩为稳定、可管理的长期语义记忆。

整个写入流程支持多层级并行:

  • 不同对话轮次之间可并行处理;
  • 同一轮中多个语义摘要可并行抽取与检索;
  • 聚类后的多个语义簇可并行决策更新。

这使得表征更新在规模扩展时仍能保持稳定吞吐。

主要包括三个步骤:

记忆抽取:并行抽取标准化记忆表征,如用户与Agent的角色摘要、事件级语义单元,用于刻画稳定状态与关键交互信息;

检索对齐:并行匹配新生成表征与已有记忆,主动发现语义重复与高度相关内容,避免无序膨胀;

聚类决策:对候选内容进行全局聚类,并对不同语义簇并行执行合并、更新或淘汰操作,持续压缩冗余信息。

该流程在保证语义质量的同时,实现了可并行扩展的写入效率,使表征更新可以随数据规模线性扩展。

2.索引层更新:离线并行构图

在Offline Batch阶段,系统采用并行化的批量构图方式,直接从全量节点构建完整索引结构。

其效率优势主要来自三个工程设计:

索引只读:构图期间索引保持只读,多线程可并行检索;

时间约束天然无环:节点仅依赖历史节点,任务之间几乎无冲突;

批量追加写入:边统一批量收集并合并,避免随机写与锁竞争。

这种方式将传统串行构图转化为大规模并行任务,在数据规模扩展时仍能保持稳定吞吐。

离线并行构图将“构建大规模记忆索引”转变为可线性扩展的并行计算问题。

Online Stream:增量表征演化与局部索引维护

在线阶段面向实时交互,强调低延迟与持续可用性:

  • 表征层持续吸收新事件,对用户画像、对象状态和多模态摘要进行增量更新;
  • 索引层基于检索完成近似挂载,并在必要时对局部结构进行调整;
  • 跨层联动确保表征变化能够及时反映到索引结构中。

在线路径允许短期近似误差,但保证结构持续稳定演化。

双路径的收敛关系

系统不要求在线阶段始终保持全局最优:

  • 在线维持近似正确与局部一致;
  • 离线周期性执行全量收敛与结构整理。

两者形成稳定闭环,在吞吐、稳定性和长期可维护性之间取得平衡。

读取阶段:从Top-K拼片段到因果闭包还原

传统RAG的读取方式,本质是“Top-K相似片段拼接”:从向量库检索若干最相似文本块,再直接拼接给模型。这在短问答场景通常有效,但在长对话和长期记忆场景中容易失效,主要体现在三点:

只看相似度,不保证前置条件齐全

缺乏结构约束,容易混淆不同时间线或线程

上下文碎片化,更像抽样而非复原

TeleMem的读取目标更接近“复原一段完整因果上下文”。系统会构造一个最小闭包子图(Minimal Closure Subgraph),将回答所需的前置依赖一并补齐:

1. 种子定位:通过Top-K找到最相关节点;

2. 因果回溯:沿依赖边反向遍历,补齐必要祖先;

3. 闭包构造:形成自洽的上下文子图;

4. 线性化输出:按时间顺序组织为模型输入序列。

最终获得的不再是零散片段,而是一段前因后果相对完整的上下文,从而显著降低碎片化带来的推理偏差。

在复杂多模态查询场景中,记忆读取可采用ReAct风格的推理范式,通过多轮think–act–observe迭代,在文本记忆与视频内容之间逐步补全信息并收敛到可靠结论。

实验结果与性能表现

在中文长程对话基准ZH-4O(平均约600轮、多角色场景)测试中,TeleMem的准确率达到86.33%,相比RAG基线提升约38个百分点,相比Mem0提升约19个百分点。

在保持较高准确率的同时,TeleMem显著降低了推理成本与延迟,不再需要每次将完整历史上下文输入模型,记忆规模也不再受限于模型的Context Window,可稳定支持千轮乃至万轮对话。

同时,该系统支持多模态记忆管理,在复杂、多源信息场景下仍能保持较好的组织与检索稳定性。

趋势观察:Agent记忆正在走向结构化与可演化

TeleMem的意义不仅是一种工程优化,也反映出一个更长期的技术趋势:Agent能力正在从“检索系统设计”逐步转向“记忆结构与持续学习机制设计”。

当Agent从一次性任务执行者演进为长期运行、持续适应环境的智能体时,记忆不再只是信息缓存层,而成为承载学习、认知演化与策略稳定性的核心基础设施。

系统是否能够稳定积累经验、避免隐性遗忘、并在时间维度上形成可解释的认知结构,将直接决定Agent的长期智能上限。

未来的智能体需要具备:

可追溯的状态与认知演化路径:能够明确知道当前决策基于哪些历史经验与学习结果;

可持续维护的长期记忆与增量学习能力:支持知识稳定累积、低成本扩展和持续更新,而非简单覆盖与堆叠;

可解释的上下文回溯与学习来源追踪能力:使行为与知识更新具备可审计性和可调控性。

从这个角度看,结构化记忆系统不仅是在提升检索效率,而是在为Agent构建一个可持续学习、可演化认知与长期稳定行为的底层支撑层

它可能成为下一代Agent基础设施从“工具型系统”迈向“长期智能体”的关键分水岭。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1223634.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【通信原理】无线电台工作原理深度解析:从电磁波到信息传输的完整技术体系

第一章 无线电台的历史演进与现代应用 无线电的发现与应用是人类技术史上最伟大的成就之一。1887年,德国物理学家赫兹首次证实了电磁波的存在,为现代无线通信奠定了理论基础。随后,意大利工程师马可尼在1895年实现了第一次远距离无线电通信&…

NMN启动细胞焕新计划,W+端粒塔研创NMN十二载,带领抗衰进入健康管理2.0时代

今年年货节,年轻人的购物车里不只有食品和潮品,更有各式保健品。当抗衰老从小众需求升级为全民共识,以预防为主的核心诉求催生了庞大的保健市场需求,一场关于健康与爱的消费热潮在年末得到集中释放。这背后,折射出…

法国用工“雷区”遍布?EOR成中企出海“合规导航仪”

法国,这个拥有浪漫之都巴黎的国度,也是全球劳动法最严格的国家之一。面对其严苛的用工规定,许多出海企业望而却步。 法国作为欧洲第二大经济体,拥有庞大的消费市场和成熟的商业环境,吸引了众多科技、制造及跨境电…

医用导管哪家好?宁波益创韦如何在高精度管材赛道脱颖而出

在介入治疗、麻醉呼吸、监护输注等临床场景中,医用导管早已成为基础却关键的组成部分。医院在选择合作供应商时,不再只问“能不能做”,而是越来越关注尺寸精度、材料安全、供应稳定性等综合指标,“医用导管哪家好”…

Logback、Log4j2、SLF4J 、ELK、EFK、Loki 傻傻分不清楚?

前言 今天我想和大家聊聊一个看似基础,却让无数开发者困惑的问题:日志框架这么多,它们到底是什么关系? Logback、Log4j2、SLF4J、ELK、EFK、Loki……这些名词像是一锅粥,很多人用了多年仍分不清彼此。 有些小伙伴…

python lambda匿名函数

一、python lambda匿名函数 1.python使用lambda来创建匿名函数 2.lambda函数是一种小型的,匿名的,内联的函数 3.lambda匿名函数具有任意数量的参数,但是只能有一个expression表达式。 4.lambda匿名函数不需要使用def关键字来定义完整的函数 5…

导师推荐!8个AI论文平台测评,本科生毕业论文全攻略

导师推荐!8个AI论文平台测评,本科生毕业论文全攻略 2026年AI论文平台测评:为何需要这份榜单? 随着人工智能技术的不断进步,AI论文平台在学术写作中的应用日益广泛。然而,面对市场上众多选择,如何…

什么是google算法?搞懂底层逻辑才不会被收割

做外贸或者是搞独立站的朋友,大概都有过这种经历:前一天网站流量还在蹭蹭涨,第二天早上起来一开后台,心都凉了半截。数据断崖式下跌,询盘直接归零。这时候你跑去问SEO专家,对方通常会一脸深沉地告诉你&…

汽车行业如何突围?天淳AI+GEO精准获客新策略

汽车行业如何突围?天淳AIGEO精准获客新策略 引言 汽车行业正面临前所未有的挑战。新能源与传统燃油车用户需求分化,客群涵盖年轻上班族、家庭用户、高端商务人士等,偏好差异显著,精准触达难度大。线上线索转化为到店试驾率低&am…

学霸同款2026 AI论文平台TOP8:研究生开题报告神器测评

学霸同款2026 AI论文平台TOP8:研究生开题报告神器测评 2026年学术写作工具测评:为何需要一份精准榜单? 在科研日益精细化的今天,研究生群体对论文写作工具的需求已从基础功能拓展到高效协同、智能辅助和格式规范等多维度。面对市…

VSCode中,通过SFTP插件管理远程服务器文件

在VSCode中,通过SFTP插件管理远程服务器文件可以极大提升开发效率。目前有几款主流插件,它们的功能侧重和操作方式有所不同,你可以根据自己的习惯和项目需求来选择。 下面的表格对比了四款主流的SFTP相关插件:插件名称 (作者/发布…

2025年棕刚玉十大定制品牌口碑排行榜,棕刚玉/碳化硅/黑碳化硅/磨料/金刚砂/铬刚玉/不锈钢灰/精密铸造砂/白刚玉棕刚玉品牌有哪些

在制造业转型升级与精密加工需求日益增长的背景下,棕刚玉作为基础性工业磨料与耐火原料,其定制化服务能力已成为衡量供应商核心竞争力的关键。当前市场,客户需求已从标准品采购转向对粒度、硬度、化学成分乃至配套解…

Windows10聚焦图片保存位置说明

桌面聚焦图片的保存位置:%USERPROFILE%\AppData\Roaming\Microsoft\Windows\Themes\CachedFiles其他类型聚焦图片的保存位置:1、%USERPROFILE%\AppData\Local\Packages\Microsoft.Windows.ContentDeliveryManager_cw…

想要随时随地做账务自动化任务就用青龙面板+cpolar

青龙面板是一款能自动化执行 JavaScript、Python、Shell 等脚本的管理工具,支持 Linux、Windows、macOS 等系统,通过网页端即可轻松管理定时任务,适合程序员、办公族、数据采集爱好者等需要处理重复性任务的人群,其优点在于无需频…

当八股文遇到实践--关于StringBuilder 和String

当八股文遇到实践--关于StringBuilder 和String$(".postTitle2").removeClass("postTitle2").addClass("singleposttitle");1.为什么拼接时使用StringBuilder 不用String ?1.String 是…

在AI语言大模型时代 Cloudera CDP(华为CMP 鲲鹏版)对自有知识的保护

在AI语言大模型时代 Cloudera CDP(华为CMP 鲲鹏版)对自有知识的保护 博文末尾处有下载方式: 下载地址: https://pan.baidu.com/s/1PDj6dySUNHotNABp7d1a0w?pwd57is 提取码: 57is 查找“Hadoop信创”,输入“CMP”恢…

1 月聚焦:晶抗生物专业度在产品中如何体现?细胞因子检测试剂盒/猪试剂盒/il-1β 试剂盒,晶抗生物公司有哪些

引言:精准检测背后的技术支撑 在生命科学研究与体外检测领域,检测试剂盒的灵敏度、特异性与稳定性直接影响科研成果的可靠性及临床诊断的准确性。作为深耕该领域的高新技术企业,上海晶抗生物工程有限公司(以下简称…

OpenAI不Open!七年功勋老将投奔宿敌,实验室沦为API代工厂

2026开年,OpenAI的「推理之父」Jerry Tworek离职了。顶尖大脑因方向冲突和资源倾斜而出走,从这一刻起,硅谷的「Open」或许只剩下一个名字,而非一家真正的AGI实验室。 1月7日,硅谷迎来又一波震动。入职近七年的技术骨干…

agent开发——深入解读短期记忆、长期记忆

在agent开发中短期记忆、长期记忆、对话历史也算是耳熟能详的概念了,一开始我一直很迷惑,经过一些时间的实践和探索,得出了一些结论,今天就用十分凝练易懂的方式让你5分钟贯通。 什么是短期记忆、长期记忆、对话历史?…

Realme真我手机关闭安装应用安全扫描

真我Realme手机关闭安装风险安全扫描自古以来,oppo系手机含一加(OnePlus)、真我(realme)用的都是同一个系统,安装时扫描时间比其他手机长很多但好在oppo系手机和对开发者网开一面,允许设置为原生安装器,使用原…