[PaperReading] MemGPT: Towards LLMs as Operating Systems

news/2025/9/23 18:31:40/文章来源:https://www.cnblogs.com/fariver/p/19106872

目录
  • MemGPT: Towards LLMs as Operating Systems
  • TL;DR
  • Method
    • Main context
  • Experiment
  • 总结与思考
  • 相关链接

MemGPT: Towards LLMs as Operating Systems

link
时间:23.10
单位:UC Berkeley
相关领域:Agent
作者相关工作:Charles Packer
被引次数:238
项目主页:
https://research.memgpt.ai/

TL;DR

大语言模型上下文长度限制了用户多轮对话以及文档分析的需求,本文参考传统计算机操作系统中多级内存管理机制,提出MemGPT算法,能够智能地管理LLM存储的多个层级。实验证明该方法能够支持long-term交互。

Method

image

Main context

  • system instructions: 保存MemGPT control flow信息,例如,如何使用不同层级内存,使用MemGPT functions的指标 等。
  • working context: unstructured text,用来存储一些关键信息,例如,用户画像,用户偏好 等。
  • FIFO Queue: 存储历史滚动信息,第一个Key是历史所有信息的概括。
    FIFO Queue:
  1. 消息生命周期管理
  • ​​接收与写入​​
  • 持久化存储: 所有会话信息将永久性地写入外部的“回忆存储”(Recall Storage)。
  • 检索与重载​​:当LLM通过函数调用(如搜索)从回忆存储中检索历史消息时,这些消息会被重新载入FIFO队列中。
  1. 上下文溢出控制
  • 警告:队列填充达到70%时,警告MemGPT及时将重要工作归档。
  • 驱逐:队列填充达到70%时,执行强制性的​​队列刷新(Flushing)​​ 操作,从队列​​头部​​(最旧的消息)开始​​驱逐一定数量的消息​​。
  • 递归摘要生成:从现有的递归摘要​​(存储在FIFO队列的第一个索引中)和​​本次被驱逐的消息​​,生成一个​​新的、更精简的递归摘要​​。

Q:图3中的Archival Storage与Recall Storage有什么区别?

  • ​​Archival Storage​​ 像一个​​主动搜集的研究资料库​​,用于存储LLM​​主动选择​​的、与任务相关的原始信息片段。
  • Recall Storage​​ 像一个​​被动记录的完整对话日志​​,用于​​自动记录​​所有发生过的交互的完整历史。

Experiment

评估的考查维度:

  • Consistency: 多轮对话前后一致性;
  • Engagement: Agent长期应当给用户提供个性化的回答;
    测试集:Multi-Session Chat (MSC) dataset

image
image

总结与思考

参考操作系统内存管理设计,但整体框架依然偏策略,不知道后续有没有 基于RL更新Agent中LLM 或者 端到端Agent的方法。

相关链接

cool paper链接:https://papers.cool/
https://zhuanlan.zhihu.com/p/711289611

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/913478.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

株洲定制网站建设做网站最贵

使用Python Django框架做一个音乐网站, 本篇音乐播放器-添加播放音乐功能实现。 目录 创建播放器数据表 设置表结构 执行创建表 命令 执行 数据表结构 添加单个歌曲 创建路由 加入播放器视图 模板处理 基类方法 子页面调用 优化弹窗 加入layui文件 基…

总线的性能指标

1.总线的传输周期(总线周期 一次总线操作所需的时间(包括申请阶段,寻址阶段,传输阶段和结束阶段 通常有若干个总线时钟周期构成 2.总线时钟周期 早期由cpu发出,而如今都是由桥接器提供的 即机器的时钟信号,计算机…

网站主页设计收费个人买卖网站怎么做

这里的状态定义一般使用DP【i】 表示 考虑前i个东西能否满足条件,然后我们枚举上一次的转移位置就好了 2369. 检查数组是否存在有效划分 需要注意的是我习惯从1开始写,所以要处理好边界的下标问题 class Solution { public:bool validPartition(vector&l…

网站建设类型的好处延安网站设计公司

闲来无事学一下设计模式,希望这23种可以一直更下去,什么时候能更完呢,也许一个月,也许一年,也许断更 设计模式六大原则 本文是23篇的第一篇,在学习设计模式之前,你需要了解下六大原则。 1、开…

网站开发平台有哪些国内很多网站不是响应式

作者:刘肉酱摩尔定律的终结将使服务于特定领域的架构成为计算的未来。一个开创性的例子就是谷歌在 2015 年推出的张量处理单元(TPU),目前已经在为超过十亿人提供服务。TPU 使深度神经网络(DNN)的计算速度提…

厦门手机网站中国制造网服务种类

1. 题目 给你一个字符串 s 和一个字符 c ,且 c 是 s 中出现过的字符。 返回一个整数数组 answer ,其中 answer.length s.length 且 answer[i] 是 s 中从下标 i 到离它 最近 的字符 c 的 距离 。 两个下标 i 和 j 之间的 距离 为 abs(i - j) &#xff0c…

网站权重一般有几个等级动漫网站源码下载

提示:RAM模型:环境安装、数据准备与说明、模型推理、模型finetune、模型pretrain等 文章目录 前言一、环境安装二、数据准备与解读1.数据下载2.数据标签内容解读3.标签map内容解读 三、finetune训练1.微调训练命令2.load载入参数问题3.权重载入4.数据加载…

VoxCPM:新一代高拟真语音生成模型

一、概述 仅需0.5B参数,VoxCPM就能用你的声音说任何话:这款开源语音模型在音色克隆和情感表达上突破极限,实时生成媲美真人的播报、演讲甚至方言,错误率低至行业新标杆。在语音合成技术快速发展的背景下,面壁智能…

Day20封装的初步认识

封装是面向对象的三大特性之一,通过private这一关键词将类的属性私有化,且为了对私有的属性进行赋值,需要提供公共的get/set方法对外暴露一个安全的操作接口,使外部可以合法的访问与修改属性 封装的作用:1,保护数…

【Qt开发】显示类控件(三)-> QProgressBar - 详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

完整教程:数据结构与算法-树和二叉树-二叉树的存储结构(Binary Tree)

完整教程:数据结构与算法-树和二叉树-二叉树的存储结构(Binary Tree)pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: …

简单的旅游网站代码做视频网站了几百万

前些天发现了十分不错的人工智能学习网站,通俗易懂,风趣幽默,没有广告,分享给大家,大家可以自行看看。(点击跳转人工智能学习资料) 微信公众号:创享日记 发送:联合定位 获…

网站销售方案深圳关键词优化

RabbitMQ六种工作模式 RabbitMQ是由erlang语言开发,基于AMQP(Advanced Message Queue 高级消息队列协议)协议实现的消息队列,它是一种应用程序之间的通信方法,消息队列在分布式系统开发中应用非常广泛。 RabbitMQ有六…

音乐电子商务网站的建设太原网站建设的公司

一、概述 嵌合抗原受体(CAR)是经过改造后赋予T细胞靶向特定抗原的新能力的受体蛋白。这些受体是嵌合的,因为它们将抗原结合和T细胞激活功能结合到一个受体中。CAR-T细胞疗法使用经过CAR改造的T细胞来治疗癌症。CAR-T免疫疗法的前提是修改T细…

互联网网站开发用哪个语言开发seo推广技术培训

AJAX 学习 AJAX 2 综合案例黑马 API01 图书管理Bootstrap 官网Bootstrap 弹框图书管理-渲染列表图书管理-添加图书图书管理-删除图书图书管理 - 编辑图书 02 图片上传03 更换图片04 个人信息设置信息渲染头像修改补充知识点:label扩大表单的范围 AJAX 2 综合案例 黑…

网站优化需求wordpress+解密成md5

Microsoft的Scott Hunter发布了Microsoft .NET Core 2.1版本的路线图。Hunter宣布Microsoft .NET Core每天约有五十万开发人员的使用量。根据Microsoft所收集的数据,在2017年9月.NET Core 2的使用量已经超过了.NET Core 1.X。有了之前成功的发布经验,Mic…

有成功案例的网站繁体网站模板

CF1100F Ivan and Burgers 静态区间,选取任意个数使得它们的异或和最大 \(n,\ m\leq5\times10^5,\ a_i\in[0,\ 10^6]\) lxl ST表,线性基 如果暴力维护线性基,线段树时间复杂度为 \(O(n\log^2n)-O(\log^3n)\) 由于重复元素对答案没有影响&…

做百度推广网站得多少钱长春火车站防疫政策

引言:当Spring Cloud遇见GraalVM,启动时间进入秒级时代 传统Spring Cloud应用因动态类加载、反射等机制导致启动缓慢(通常超过30秒),在Serverless和Kubernetes滚动更新场景下成为性能瓶颈。Spring Cloud 2023.x通过**G…

专门做男装的网站网站建设分金手指专业十四

为便于广大科技工作者更好的了解中国汽车行业首个英文学术期刊《Automotive Innovation》,并更快的定位到自己感兴趣的论文,编辑部把2018-2019年刊出的70篇论文摘要进行集结,并按照节能与环保(Energy-saving & Eco-systems)、智能网联汽车…

单页面网站设计网站欣赏wordpress 收费主题

摘要:很多人想用十全十美来修饰一样东西,比如软件,对于客户来说,当然希望他们的软件能做到完美。虽然很多专家说利用一些规范可以让软件达到更好!但是在现实开发中,真的会有那么完美的软件吗? 最…