【AI编程】上下文窗口告急?Cursor五大“动态加载“策略让AI助手效率起飞,token消耗直接砍半!

写在前面

前两天写了一篇关于 [Manus 上下文工程]的学习笔记,分享了 Manus 团队在管理 Agent 上下文(Context)方面的三大核心策略:缩减(Reduction)、隔离(Isolation)、卸载(Offloading)

其实前几天(2026 年 1 月 6 日),Cursor 团队也发布了一篇技术博客:Dynamic Context Discovery[1],分享了他们在上下文工程(Context Engineering)方面的实践,推荐大家一起阅读学习。

读完之后发现,虽然两家公司的表述视角不同,但核心理念高度一致——都在试图解决同一个问题:

如何在保持 Agent 智能的同时,避免上下文窗口被撑爆?

所谓「上下文窗口(Context Window)」,就是 LLM 一次能「看到」的信息量上限。超过这个上限,要么报错,要么需要压缩/丢弃部分内容。

两家公司用不同的视角表达了相似的理念:

  • Manus:压缩 + 卸载 + 隔离
  • Cursor:少预先注入,多动态发现

殊途同归。

本文是我读完上述博客后的学习笔记,仅用作学习交流,可能存在理解偏差或事实问题,欢迎指正。推荐大家直接去读原文,我的笔记难免存在压缩和转译偏差。


核心理念:动态 vs 静态

Cursor 提出了一个非常清晰的二分法:

上下文类型定义特点
静态上下文(Static Context)预先注入到 prompt 中始终存在,无论是否需要
动态上下文(Dynamic Context)Agent 按需拉取只有必要时才进入上下文窗口

Cursor 团队的核心发现是:少给一点,让 Agent 自己找。模型越强,这个策略越有效。

“As models have become better as agents, we’ve found success by providing fewer details up front, making it easier for the agent to pull relevant context on its own.”

这与 Manus 的「保持边界清晰,然后让开(Keep the boundary clear — then get out of the model’s way!)」理念如出一辙。


五大核心策略

Cursor 将这一理念落地为五个具体策略,我理解起来核心思路是:把一切都变成文件,让 Agent 按需检索

策略一:长工具响应转为文件

问题:工具调用可能返回大量 JSON,导致上下文膨胀。

常规做法:截断长响应。但这会导致数据丢失,可能包含重要信息。

Cursor 做法

工具返回长响应 → 写入文件 → 返回文件路径 → Agent 用 tail 查看末尾 → 按需读取更多

这与 Manus 的「双版本机制」异曲同工——完整版存储在文件系统,紧凑版(引用)进入上下文。

💡关键洞见:不要截断,要卸载。截断是信息丢失,卸载是信息转移。


策略二:摘要时引用聊天历史

问题:当上下文窗口填满时,需要触发摘要。但摘要是有损压缩,Agent 可能遗忘关键细节。

Cursor 做法

  1. 将聊天历史保存为文件
  2. 摘要后给 Agent 提供历史文件的引用
  3. 如果 Agent 发现摘要中缺少细节,可以搜索历史文件恢复

摘要时引用聊天历史示意图

这张图很好地展示了这个机制:

  • 左侧:上下文超限,触发摘要
  • 右侧:摘要后 Agent 发现需要 S3 位置信息,于是搜索历史记录(Searched agent transcript),成功找回

💡关键洞见:有损压缩(Lossy Compression)+ 恢复能力。

摘要的本质是有损压缩——为了节省空间,必然会丢失一些细节。正如原文所说:“The agent might have forgotten crucial details about its task.”(Agent 可能会忘记任务的关键细节。)

Cursor 的解决思路是:接受有损,但保留恢复能力。摘要后,Agent 仍然可以通过搜索历史文件找回缺失的信息。这样既控制了上下文大小,又不会真正丢失信息。

这与 Manus 的结构化摘要策略形成互补——Manus 强调「如何做好摘要」,Cursor 强调「摘要后如何恢复」。


策略三:支持 Agent Skills 开放标准

Cursor 支持 Agent Skills[2],一个用于扩展 AI Agent 能力的开放标准。

什么是 Agent Skills?Skill 是一个可移植的、版本控制的知识包,用于教 Agent 如何执行特定领域的任务。Cursor 启动时会自动从.cursor/skills/目录发现 Skills。(⚠️ 该功能目前仅在 Nightly 版本可用)

这与动态上下文发现的关系是什么?

Agent Skills 的设计完美体现了「静态存目录,动态读正文」的理念:

组件存储位置发现方式
Skill 名称和描述静态上下文始终可见
Skill 详细内容文件系统(SKILL.mdgrep(文本搜索)/ 语义搜索动态发现
可执行文件/脚本文件系统Agent 按需调用

这与 Manus 的分层动作空间(Hierarchical Action Space)理念一致,也与 Claude Code 的 Skills 功能[3]采用相同的**渐进式披露(Progressive Disclosure)**策略。

💡关键洞见:静态只存目录,动态才读正文。

传统做法:把所有 Skill 的完整内容都塞进 system prompt → 上下文膨胀,大部分内容用不到。

Cursor 做法:system prompt 只放 Skill 的名称和简短描述(几十个字),详细内容存在SKILL.md文件里。当 Agent 判断需要某个 Skill 时,再通过搜索读取完整内容。

这就是「渐进式披露(Progressive Disclosure)」——先给概览,按需深入。

📝笔者批注:这种「静态存目录,动态读正文」的做法并非 Cursor 独创。Claude Code 也采用了类似的 Skills 机制,Manus 的分层动作空间本质上也是同样的思路。这种模式正在逐渐成为 AI Agent 上下文管理的行业惯例——当 Agent 需要扩展能力时,不要把所有内容都塞进 prompt,而是建立一个「能力目录」,让 Agent 按需检索。


策略四:高效加载 MCP 工具

MCP(Model Context Protocol)是一个让 AI Agent 连接外部工具和数据源的开放协议。

问题:MCP Servers 可能包含很多工具,每个工具都有长描述,显著膨胀上下文窗口。更糟糕的是,大多数工具在单次任务中根本用不到。

Cursor 做法

  1. 将工具描述同步到文件夹(每个 MCP Server 一个文件夹)
  2. 静态上下文只包含工具名称列表
  3. Agent 需要时通过文件系统查找工具详情

实测效果

在调用 MCP 工具的任务中,这个策略减少了 46.9% 的总 Agent token 消耗(统计显著)。此外,由于工具信息存在文件中而非仅在上下文中,即使 MCP Server 需要重新认证,Agent 也不会像以前那样直接「忘记」这些工具——它仍然知道这些工具的存在,可以主动告知用户需要重新认证。

MCP 工具动态发现减少 46.9% token

💡关键洞见:同样的模式再次出现——名称列表静态加载,详细描述动态检索。这与 Agent Skills 的设计如出一辙。

📝笔者批注:原文还提到一个有趣的架构观点:Cursor 认为优化 token 消耗是 coding agent 的责任,而非 MCP Server 的责任。这意味着我们不应期望每个 MCP Server 都为 token 优化做适配,而应该在 Agent 层面统一解决。


策略五:终端会话视为文件

问题:用户经常需要把终端输出复制粘贴给 Agent,问「为什么我的命令失败了?」

Cursor 做法

  • 将集成终端输出同步到本地文件系统
  • Agent 可以直接引用终端历史
  • 对于长日志,Agent 可以用grep(文本搜索命令)只搜索相关输出

优势

  • 用户无需手动复制粘贴
  • 终端历史可能很长,但 Agent 只需 grep 相关部分
  • 与 CLI 类 coding agent(如 Claude Code)的体验一致,但是动态发现而非静态注入

最后的启示

结合 Manus 和 Cursor 的实践,或许上下文工程的最佳实践核心可以归纳为一句话:

给 Agent 一个文件系统,而不是一个塞满内容的 prompt。

为什么是文件?因为文件是一个简单、强大、且面向未来的抽象。正如 Cursor 在原文中所说:“It’s not clear if files will be the final interface for LLM-based tools.”——虽然不确定文件是不是最终答案,但它足够安全。

这也与 Karpathy 对上下文工程的定义[4]高度一致:

上下文工程是一门精细的艺术和科学,旨在为 Agent 轨迹的下一步填充恰到好处的信息。

恰到好处——不多也不少。而实现「恰到好处」的方法,就是动态发现


学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1184378.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flutter艺术探索-Flutter性能优化基础:const与const构造函数

Flutter 性能优化基础:深入理解 const 与 const 构造函数 引言:为什么我们应该关心 const? 在 Flutter 开发中,咱们可能都遇到过这样的场景:界面稍微复杂一点,滚动起来就感觉不那么跟手,或者频繁…

【Claude Cowork】核心技术架构与实现原理——桌面级Agentic AI的技术革命

文章目录目录一、Cowork 核心定位与设计理念二、Cowork 底层核心技术架构拆解2.1 底层隔离执行层:基于AVF的虚拟化安全架构2.2 中层Agent核心层:Claude Agent SDK与三大核心技术(1)MCP协议:AI时代的「通用接口」&#…

首程控股(0697.HK)机器人投资组合回报超 4 倍 直播首秀揭秘产业变现新路径

近日,机器人产业赛道传来重磅消息——首程控股(0697.HK)宣布其机器人业务板块即将于本周日(1月18日)晚上7:50,在抖音号及视频号同步开启直播首秀。这不仅是首程在公众传播层面的重要动作,更标志着其经过数年深耕,已在机器人领域构建起从产业投资、生态合作到市场拓展的完整价值…

小白必看!RAG技术让大模型不再“胡说八道“,5分钟入门检索增强生成

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索(Retrieval)和文本生成(Generation)的自然语言处理技术。它旨在通过从外部知识源(如数据库、文档或互联网&a…

API推荐界的“断舍离“:大模型让推荐列表自己“做减法“,准确率暴涨21.59%,小白也能秒懂!

“固定 top-N”就像给所有脚塞同一码鞋——83%的API推荐因此错配。该研究用TinyLlama做“伸缩尺”,让推荐列表随场景自动长短,同步吐出解释;8217个真实 mashup 测试,平均只推1.79个API就命中81.3%,比最佳基线猛涨21.59…

2026评测:黑龙江中低压电气厂商谁更受青睐,工控产品/电气自动化/施耐德电气/中低压电气,中低压电气公司口碑推荐 - 品牌推荐师

评测背景 随着东北地区工业升级与基础设施建设的持续推进,中低压电气市场迎来结构性增长机遇。黑龙江作为东北工业重镇,对电气产品的稳定性、技术适配性及服务响应效率提出更高要求。本次评测聚焦黑龙江及周边市场主…

社区终端发布新版,进一步去掉枷锁,让使用更简单

根据社区朋友@万码千钧的反馈,做了本次修改:去除了博客园强制发布流程,如果不需要,从配置开始置空即可。 发表周总结时,也不再强制使用 Edge 浏览器,有哪个用哪个。 添加了参数控制是否公开发表,添加--no-publi…

RPA进化史深度解析:从录屏工具到智能数字员工

每天面对大量重复的数据复制粘贴、跨系统表单填报、订单信息核对,耗费大量工时却难创造核心价值——这是多数职场人的日常困境。而RPA机器人的出现,正打破这种低效循环,成为数字化转型中的关键工具。或许你对RPA的名称并不陌生,但…

救命神器!MBA必看!9款AI论文软件测评TOP9

救命神器!MBA必看!9款AI论文软件测评TOP9 2026年MBA学术写作工具测评:为何需要这份榜单? 随着人工智能技术的不断进步,AI论文软件逐渐成为MBA学习与研究中不可或缺的辅助工具。然而,市面上产品繁多&#xf…

AQS、Condition

目录一、AQS抽象类1.自定义AQS2.如何实现多个线程按序执行3.独占锁3.1 acquire()方法(ReentrantLock源码为例)3.2 release()方法(ReentrantLock源码为例)4.共享锁4.1 acquireShared()方法(Semaphore源码为例&#xff0…

震惊!大模型推理技术天花板揭秘:从“内存墙“到“算力突围“,小白也能秒懂的AI开发进阶指南

1. 介绍:计算范式与推理架构的演进 随着人工智能领域进入以生成式预训练变换器(Generative Pre-trained Transformer, GPT)为代表的大模型时代,模型参数规模从数十亿(Billion)级别迅速攀升至万亿&#xff…

写论文好用的AI:从辅助构思到质量控制的智能伙伴

在学术研究领域,人工智能已从遥远的概念演进为触手可及的现实助手。对于论文作者而言,“好用的AI”绝非指能够一键生成全文的替代工具,而是指那些能够嵌入研究全流程、切实提升效率与质量、且符合学术伦理的智能伙伴。这些工具能够在文献迷雾…

大模型开发者的福音:一文搞懂Agent评估,让你的模型不再“翻车“!

一、Agent 评估为什么这么重要 LLM 的输出是存在不可控因素的,而对于一个线上生产级别的大模型应用来说,稳定性是最重要的,成熟的评估方案不仅可以让大模型应用更加稳定,同时也可以发现模型的潜力和边界,以此更好的迭…

Matlab: 测试MMS (Method of Manufactured Solutions)

使用泊松方程测试MMS(Method of Manufactured Solutions)方法适用性 % % TEST MMS (Method of Manufactured Solutions) %function poissonMMS()%% ucn*(x-x0)-sn*(y-y0)% vsn*(x-x0)cn*(y-y0)% T(x,y)exp(-au^2-bv^2)%thetapi/4;p.a10;p.b100;p.cncos(theta);p.snsin(theta);p…

在3D设计课上,国产CAD兼顾入门与实战

我在职校教3D设计课,真的很头疼用哪个牌子的软件。有些孩子基础很差,对电脑操作很不敏感,不能用过于复杂的软件作为教学工具,但用的软件太简单又不能很好的衔接企业实际岗位标准,课就白上了。要选一款既要贴合学生的认…

【AI编程干货】2025大模型开发已从“随机生成“进化到“确定性工程“,这篇技术指南让你少走三年弯路!

01 宏观生态概览:从随机生成到确定性工程 1.1 2025年 AI 工程化的范式转移 在2023年至2025年的短短两年间,大语言模型(LLM)的工程生态经历了一场深刻的范式转移。如果说2023年是“聊天机器人(Chatbot)”…

2026年优秀的桥架支架,热浸锌桥架,电缆沟支架厂家采购优选榜单 - 品牌鉴赏师

引言在现代基础设施建设中,电缆支架、隧道支架、电缆沟支架、管廊支架、热浸锌桥架以及桥架支架等产品扮演着至关重要的角色。它们的质量和性能直接关系到电缆系统的安全与稳定运行。为了帮助广大采购商在众多厂家中挑…

大模型开发必看!LangChain 1.0 MCP调用实战,解决DeepSeek兼容性问题,附完整代码

上一篇文章中,我为大家介绍了LangChain1.0框架下调用人机交互式大模型的方法。今天,我们聚焦另一个核心实操场景——MCP(Model Context Protocol)的调用流程,以及实践中常见报错的解决方案。 一、基础铺垫&#xff1a…

AI Agent架构大揭秘:从感知到行动,让代码拥有“大脑“!2026年AI开发必备技能,程序员速来围观!

AI Agent 是2026年AI生态的核心概念,它指的是一个具备自主决策、规划和执行能力的数字实体,不再局限于简单的问答或生成式AI,而是能像人类员工一样处理复杂任务。简单来说,Agent 能理解用户意图、分解目标成步骤、调用外部工具或数…

2026/1/19-又是会考

前天会考去了。 重要的不是会考,重要的是我要回学校【生无可恋.jpg】 但是能和 lzm 玩,感觉又活了一些。16 号下午去看考场,然后被打信息差了。 教室和办公室都搬到科技楼去了,我还以为办公室还在教学楼捏。 于是在…