这才是AI大模型工程师的必杀技!Cursor + Agent上下文工程深度解析,学会直接涨薪!

Cursor 的 agent 现在为所有模型使用动态上下文(dynamic context)。它在保持相同质量的同时,更智能地填充上下文。使用多个 MCP 服务器时,这可将总 token 数量减少46.9%。

代码 Agent正在迅速改变软件的开发方式。它们的快速进步既来自更强的 Agent 模型,也来自更好的上下文工程,用于引导其行为。

随着模型在充当 Agent 方面的能力不断提升,我们发现,预先提供更少的细节,反而能让 Agent 更容易自主地按需提取相关上下文。我们将这一模式称为动态上下文发现(dynamic context discovery),与始终被包含的静态上下文(static context)相对。

一、用于动态上下文发现的文件

动态上下文发现的 token 使用效率要高得多,因为只会将必要的数据引入上下文窗口。同时,它还能通过减少上下文窗口中可能造成混淆或互相矛盾的信息量来提升 agent 的回复质量。

以下是在 Cursor 中使用动态上下文发现的做法:

  1. 将较长的工具响应转化为文件
  2. 在总结时引用聊天记录
  3. 支持 Agent Skills 开放标准
  4. 高效地仅加载所需的 MCP 工具
  5. 将所有集成终端会话视为文件

1. 将较长的工具响应转换为文件

工具调用可能会因为返回体积巨大的 JSON 响应而显著增加上下文窗口的大小。

对于 Cursor 中的自研工具,比如编辑文件和搜索代码库,我们可以通过合理的工具定义和精简的响应格式来避免上下文膨胀,但第三方工具(如 shell 命令或 MCP 调用)并不能天然享受同样的优化。

常见的做法是,代码 Agent 会截断较长的 shell 命令输出或 MCP 结果。这可能导致数据丢失,其中可能包括你希望保留在上下文中的重要信息。在 Cursor 中,我们则是把输出写入文件,并赋予 Agent 读取该文件的能力。Agent 会调用tail来检查末尾内容,如有需要再继续向后读取更多内容。

这样在接近上下文上限时,就能减少不必要的额外总结。

2. 在摘要过程中引用对话历史

当模型的上下文窗口被填满时,Cursor 会触发一次摘要步骤,为 Agent 提供一个全新的上下文窗口,其中包含它迄今为止工作的摘要。

但由于这是对上下文的有损压缩,Agent 的掌握情况在摘要之后可能会变差,可能会忘记任务中的关键细节。在 Cursor 中,我们将对话历史作为文件提供,以提升摘要的质量。

在达到上下文窗口上限后,或者用户决定手动进行摘要时,我们会给 Agent 一个指向历史文件的引用。如果 Agent 发现自己需要的更多细节没有包含在摘要中,它可以在历史中搜索以找回这些信息。

3. 支持 Agent Skills 开放标准

Cursor 支持 Agent Skills,这是一种用于为编码 Agent 扩展专用能力的开放标准。与其他类型的 Rules 类似,Skills 由文件定义,这些文件会告诉 Agent 如何执行特定领域的任务。

Skills 还包括名称和描述,可以作为"静态上下文"包含在系统提示词中。随后,Agent 可以进行动态上下文发现,使用诸如 grep 和 Cursor 的 语义搜索 等工具自动引入相关的 Skills。

Skills 还可以打包与任务相关的可执行文件或脚本。由于它们本质上只是文件,Agent 可以轻松找到与某个特定 Skill 相关的内容。

4. 高效地仅加载所需的 MCP 工具

MCP 有助于访问受 OAuth 保护的资源,比如生产环境日志、外部设计文件,或企业内部的上下文和文档。

有些 MCP 服务器包含很多工具,且往往带有很长的描述,这会显著膨胀上下文窗口。即使这些工具始终被包含在提示中,其中大部分实际上并不会被使用。如果你使用多个 MCP 服务器,这个问题会被进一步放大。

指望每个 MCP 服务器都为此进行优化并不现实。我们认为,降低上下文占用是编码 Agent 的责任。在 Cursor 中,我们通过将工具描述同步到一个文件夹,为 MCP 提供了动态上下文发现能力。

Agent 现在只会收到一小段静态上下文(包括工具名称),并在任务需要时再去查找具体工具。在一次 A/B 测试中,我们发现:在会调用 MCP 工具的运行中,这一策略 将 Agent 的总 token 消耗减少了 46.9%(这一结果在统计上显著,但会随已安装 MCP 的数量产生较大波动)。

这种基于文件的方案还带来了一个好处:可以向 Agent 传达 MCP 工具的状态。比如,以前如果某个 MCP 服务器需要重新认证,Agent 会完全"遗忘"这些工具,让用户摸不着头脑。现在,它可以主动提示用户进行重新认证。

5. 将所有集成终端会话视为文件

过去你需要把终端会话的输出复制粘贴到 Agent 的输入中,Cursor 现在会自动将集成终端的输出同步到本地文件系统。

这样你就可以轻松询问"为什么我的命令失败了?",并让 Agent 理解你具体在引用什么。由于终端历史可能很长,Agent 可以只对相关输出进行 grep,这对于像服务器这类长时间运行的进程所产生的日志尤其有用。

这与基于 CLI 的编码 Agent 所看到的情况相似:它们同样可以在上下文中访问先前的 shell 输出,但这里是动态发现的,而不是静态注入的。

二、简单抽象

目前还不清楚,文件是否会成为基于 LLM 的工具的最终接口形式。

不过,随着编码 Agent 的快速发展,文件一直是一种简单而强大的原语,相比再造出一种无法充分兼顾未来的抽象层,也是更安全的选择。请持续关注,我们将在这个方向分享更多令人兴奋的进展。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1136318.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

导师严选10个AI论文平台,继续教育学生轻松搞定论文写作!

导师严选10个AI论文平台,继续教育学生轻松搞定论文写作! AI工具助力论文写作,轻松应对学术挑战 在当今快节奏的学术环境中,继续教育学生面临着论文写作的诸多挑战。无论是选题、构思还是最终的修改,每一步都可能成为一…

CRNN OCR WebUI详解:可视化操作让识别更简单

CRNN OCR WebUI详解:可视化操作让识别更简单 📖 项目简介 在数字化转型加速的今天,OCR(Optical Character Recognition,光学字符识别)文字识别技术已成为信息自动化处理的核心工具之一。无论是发票扫描、文…

基于多主体主从博弈的区域综合能源系统低碳经济优化调度MATLAB实现

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f34…

5个高质量中文语音合成镜像推荐:Sambert-Hifigan开箱即用

5个高质量中文语音合成镜像推荐:Sambert-Hifigan开箱即用 🎯 为什么选择中文多情感语音合成? 随着智能客服、有声阅读、虚拟主播等应用场景的爆发式增长,高质量、富有情感表现力的中文语音合成(TTS)技术已…

别再被 Exactly-Once 忽悠了:端到端一致性到底是怎么落地的?

别再被 Exactly-Once 忽悠了:端到端一致性到底是怎么落地的? 大家好,我是 Echo_Wish。 混大数据这些年,我发现一个特别有意思的现象:凡是系统一出问题,PPT 上一定写着:Exactly-Once。 凡是真正线…

API 文档:软件工程质量的重要保障

API文档:软件工程质量的基石——从契约本质到实践体系的全面解析 元数据框架 标题:API文档:软件工程质量的基石——从契约本质到实践体系的全面解析关键词:API文档, 软件工程质量, 契约式设计, 活文档, OpenAPI, 文档自动化, 开发…

大模型服务告警的“痛点解决”:架构师的5个策略,覆盖冷启动_过载_错误!

大模型服务告警的“痛点解决”:架构师的5个策略,覆盖冷启动/过载/错误! 关键词:大模型服务、告警系统、冷启动、过载保护、错误处理、架构策略、可观测性 摘要:随着大语言模型(LLM)在各行各业的规模化应用,大模型服务的稳定性和可靠性成为企业关注的核心问题。然而,大…

救命神器10个AI论文写作软件,MBA毕业论文必备!

救命神器10个AI论文写作软件,MBA毕业论文必备! AI 工具如何成为 MBA 论文写作的得力助手 MBA 学生在撰写毕业论文时,常常面临时间紧张、内容繁杂、逻辑不清等多重挑战。而 AI 工具的出现,为这一过程带来了全新的解决方案。通过智…

ModbusRTU与RS485结合在工厂自动化中的操作指南

工厂自动化通信实战:ModbusRTU RS485 深度拆解与避坑指南在一次某机械制造厂的产线调试中,工程师小李遇到了一个典型问题——PLC读不到温控表的数据。HMI上温度值始终为零,现场排查发现线路连接正常、地址设置无误,但通信就是时断…

CRNN模型微服务化:容器化部署最佳实践

CRNN模型微服务化:容器化部署最佳实践 📖 项目背景与技术选型动因 在当前数字化转型加速的背景下,OCR(光学字符识别) 技术已成为文档自动化、票据处理、智能客服等场景的核心支撑能力。传统OCR方案多依赖重型商业软件或…

逻辑门的多层感知机实现:初学者核心要点解析

用神经网络“重新发明”逻辑门:从XOR难题看多层感知机的诞生你有没有想过,计算机最底层的运算——那些看似简单的与、或、非门——其实可以用一个会“学习”的神经网络来实现?这听起来像是在绕远路:明明用几根导线和晶体管就能搞定…

vivado安装包在Artix-7上的快速安装与验证方法

如何在Artix-7项目中高效安装与验证Vivado:省时40%的实战指南 你有没有经历过这样的场景?新接手一个基于Xilinx Artix-7的FPGA项目,兴冲冲下载了Vivado安装包,结果解压一小时、安装两小时,磁盘空间直接干掉35GB——而…

Transformer语音模型部署难?Sambert-Hifigan镜像全搞定

Transformer语音模型部署难?Sambert-Hifigan镜像全搞定 🎙️ Sambert-HifiGan 中文多情感语音合成服务 (WebUI API) 📖 项目简介 在当前AIGC浪潮中,高质量语音合成(TTS)已成为智能客服、有声读物、虚拟主播…

某银行如何用CRNN OCR实现自动票据识别,效率提升200%

某银行如何用CRNN OCR实现自动票据识别,效率提升200% 引言:OCR技术在金融场景中的核心价值 在银行业务中,每天需要处理海量的纸质票据、发票、合同和客户资料。传统的人工录入方式不仅耗时耗力,还容易因疲劳或字迹模糊导致信息错误…

语音情感分类与映射机制:让机器‘有感情’地说话

语音情感分类与映射机制:让机器‘有感情’地说话 📌 引言:从“机械朗读”到“情感表达”的跨越 在传统语音合成(Text-to-Speech, TTS)系统中,机器生成的语音往往缺乏情感色彩,听起来冰冷、单调&…

RS485通讯基础概念完整指南(初学者必备)

RS485通信从零开始:为什么它能扛住工厂干扰跑1200米?你有没有遇到过这样的问题:用单片机读传感器,接线一长,数据就开始乱跳?现场电机一启动,串口通信直接“失联”?想连十个设备&…

电气互联系统有功-无功协同优化模型MATLAB代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f34…

Sambert-Hifigan镜像部署指南:WebUI+API双模式,快速接入生产环境

Sambert-Hifigan镜像部署指南:WebUIAPI双模式,快速接入生产环境 📌 项目背景与技术价值 在智能语音交互、有声内容生成、虚拟人等应用场景中,高质量的中文语音合成(TTS)能力已成为核心基础设施。传统的TTS系…

Sambert-HifiGan能力全面测试:情感表达与自然度评测

Sambert-HifiGan能力全面测试:情感表达与自然度评测 📊 测试背景与目标 随着语音合成技术在智能客服、有声阅读、虚拟主播等场景的广泛应用,用户对合成语音的情感表现力和语音自然度提出了更高要求。传统的TTS系统往往只能生成“机械式”语音…

系统学习 screen 命令在 DevOps 远程流程中的角色

为什么老派却可靠的screen仍是 DevOps 工程师的“终端救命绳”?你有没有过这样的经历:正在远程服务器上跑一个数据库迁移脚本,眼看着进度条走到 90%,突然网络一卡,SSH 断了——再连上去时,进程早已消失&…