为什么Context Engineering突然爆火?大模型开发者必学指南,建议收藏

上下文工程是提示词工程的扩展,关注如何有效管理大模型的上下文信息。随着AI能力提升和应用深入,它变得日益重要,涵盖RAG、记忆管理、工具调用等技术手段。作为AI工程化的关键基础,上下文工程决定了模型能否发挥最大潜力,是连接模型与现实世界的桥梁,未来可能成为AI团队中不可或缺的专业角色。

1、为什么最近大家都在聊Context Engineering?

这个词似乎突然爆火,但这个概念并不是新的概念,而是从大语言模型诞生并进入应用层之后一直存在。只不过随着AI能力的发展和实际应用需求的提升,它终于被重新放上了聚光灯下,Andrej Karpathy[1]6月25日的推文助推下,更多人关注了

本文将带你从提示词工程一路走到上下文工程,梳理清楚它们的关系,并了解为什么上下文工程这么重要

2、TL;DR

对于不想看全文的,可以直接看摘要:

本质来说上下文工程(Context Engineering)和提示词工程(Prompt Engineering)是一个东西,前者是一个更加fancy的叫法,也从狭义的提示词扩大到上下文的维度,涵盖更加广的上下文工程实践

用Agent的例子来说明,就是Agent每次执行的时候都需要有合适的上下文(太多太少不够准确的都不行),这些上下文可以是预设的(比如预先写好的系统提示词),也可以是运行时获取的(通过工具调用外部获取),配合一些诸如RAG、Memory、读写、Compact/Compression等手段可以更好的管理上下文,因此上下文工程就是如何将合适的信息填充到有限的上下文里的艺术和科学

3、Prompt vs Context

在与大语言模型(LLM)打交道的过程中,我们其实一直在围绕两类输入工程打转:提示词工程(Prompt Engineering)和上下文工程(Context Engineering)

前者更像是在告诉模型它是谁,而后者是喂给模型它需要知道的相关信息

其实非常好理解,在基于LLM的应用运行期间,需要一些预设背景信息,且拥有合适的上下文信息,尤其是现在以Agent为主的应用,多轮次交互中每一轮次都需要不同的、合适的且准确的上下文信息,才可以最大化Agent的效果

4、提示词工程Prompt Engineering

最早底层模型能力还没有被大幅提升的时候,大家都在利用提示词挖掘底层模型的能力,我还记得当时Sam Altman还说过写提示词这个东西有些人很有天份,一下就知道怎么写

早期大家都是管理一堆的提示词,用于不同的使用场景,这也衍生出了一些诸如:GPTs,Character.AI、星野等这一些“Cosplay”的AI应用,这类应用本质上就是允许用户去编写提示词来驱动模型以某种形式去回复用户的问题

通过提示词控制也是相对符合直觉的一个行为,提示词工程里还有一些更加高阶一点的手段,比如:

•少样本提示(Few-shot Prompt):给出几个类似的示例,引导模型模仿

•零样本提示(Zero-shot Prompt):不给任何示例,让模型自主决定输出

•思维链提示(Chain-of-Thought Prompt):引导模型一步步说出来的自我思考过程,重点是提示格式而不是答案示例

少样本提示(Few-shot Prompt):

文本:我太喜欢这部电影了! 情感:正面 文本:这道菜太难吃了。 情感:负面 文本:还行吧,我觉得。 情感:

零样本提示(Zero-shot Prompt:

文本:还行吧,我觉得。 情感:

思维链提示(Chain-of-Thought Prompt):

文本:还行吧,我觉得。 情感分析:我们来分析一下这句话。"还行吧" 表示中等、不好不坏,"我觉得" 表示语气不确定或者没有强烈的情绪。整体来看,这句话情绪不强烈,偏向中性。 情感:中性

因此本质上提示词工程就是在告诉模型开始处理任务之前的一些预设,可以很有效的帮助模型做一个锚定,在此之后就让模型在这个范围内和方向上自我发挥

在这个阶段模型没有任何外部知识,也没有记忆等,全部依赖于提示词本身

5、上下文工程 Context Engineering

上下文窗口一直是模型能力的重要衡量指标之一,原因就是上下文对于模型应用效果非常关键

前面提到最早通过较为直觉的方式来写提示词,随着底层模型的发展和模型应用的普及,对于效果的追求也越来越高,从最早的泛娱乐式消费,到生产力提升的需求,上下文是相对于模型微调来说更加低成本且可操作性更高的方式来提升整体的效果

在上下文工程领域延伸出很多手段:

•RAG(Retrieval-Augmented Generation,检索增强生成):通过语义化响亮搜索,从知识库中检索与用户问题最相关的文档片段,并拼接到上下文,提升回答准确性

•Memory(记忆):引入长短期记忆,帮助模型回顾过往记录

•Tool Calling/MCP(工具调用):通过结构化提示词告诉模型如何调用预定工具(如数据库查询、API调用等)来获取外部信息,是一种与世界连接的输入增强方式

我们是可以参考Context Engineering for Agents里所做的分类(主要针对Agent语境下的分类):

•写上下文(Write Context):上下文窗口限制,需要把过往的上下文存到外部,必要时召回

•选择上下文(Select Context):从已经保存的数据中选择合适的部分注入到上下文窗口中,帮助LLMs更好完成任务

•压缩上下文(Compressing Context):上下文超出的情况下,对上下文进行合理的压缩保留必要的最小内容

•隔离上下文(Isolating Context):拆分并分配不同的上下文给不同的子智能体或子任务,提高效率和清晰度

目前大家都在上下文工程领域持续深耕。简单说,就是底层模型的性能提升是取决于几家头部模型厂商的,在有限的情况之下,应用层都是在拼上下文处理能力以及和用户交互的UI/UX

因此我们其实可以留意到目前AI应用都是围绕这两点展开的,如何帮助模型更好的获取上下文去完成用户的需求+如何用更好的交互方式让用户与模型交互。反观UI/UX已经是一个体系化的学科之后,对于一个AI应用能否足够好用,就取决于上下文工程的能力。这样想我们就能知道为什么上下文工程如此重要且受关注面这么广

我们可以看到早期的RAG就是一种相对固定的外部信息获取,一般我们在RAG里做召回会用topk,也就是最匹配的k份材料(chunk)给到模型,本质上就是因为上下文是有限的,如何获取最合适的材料,就是RAG里需要不断去摸索的方向。

记忆模块也是一部分,现在也有很多人在这块投入研究,我觉得是一个非常值得投入研究的领域,记忆可分为长时记忆和短期记忆,通过ChatGPT这个APP我们也可以看得到一些实践,现在它可以召回以前的对话(本质上也是向量搜索这类方式),这样就是通过对话来实现记忆recall的一个过程,同时它也会在日常对话中去记录一些关键点到记忆条目里,这样就能建立一个长期记忆(最早记忆是会满的,我觉得没理由让用户去手动删除和管理记忆,现在就没有这个问题了)。

前段时间疯狂流行的MCP,也就是和以前的Function Tool,或者Tool Calling一样,就是让模型能调用一些预设的工具,去获取对应的信息来做决策,也是上下文工程的一种,这个方向是对于现有服务和基础设施,甚至是物理世界交互的一个标准接口,所以意义深远

总体而言,上下文工程涵盖的就是很简单的东西,给到模型的上下文内容,但是期间涉及的手段有很多值得研究和发展的领域和方向。这个也为未来AGI方向提供了一个必要的基础

6、界限并没有那么清晰

通常系统提示词不太会变,这个是有别于上下文的,否则严格意义上来说,提示词也是上下文的一部分,所有模型能看到的内容都统称为上下文。因此实际上现在讨论Context Engineering并不是一个全新的概念呢,而是自大语言模型诞生之初就一直存在的,只不过现在规范化、专业化和学科化

现在越来越多人认识到,随着底层模型能力的提升,prompt的需求程度在降低,现在演变出一个更加fancy的叫法,就是上下文工程Context Engineering,从更加广义的角度来定义,上下文工程自此进入人们的视野,也使得越来越多人关注

因此可以认为这两个工程都是在同样的目的:目标很明确,就是通过合理的处理组装上下文,让模型效果最大化

举例来说,我们来看看Claude Code的系统提示词(System Prompt):

从Claude Code的System Prompt中可以看出,我们可以看到它融合了角色设定、少样本提示、工具调用等手段,同时通过 Tool 使用能力动态扩展上下文,比如支持查看文件、编辑代码、提交 Git、拉取图片等。这种设计结合了提示词工程与上下文工程,是一种典型的 Prompt + Context 混合型应用,本质上构建出了一个具备自主决策能力的 Agent

7、新学科的出现

这边有一段在Context Engineering for Agents[2]这篇文章中的一段话,我觉得描述得很好:

As Andrej Karpathy puts it, LLMs are like a new kind of operating system[3]. The LLM is like the CPU and its context window[4] is like the RAM, serving as the model’s working memory. Just like RAM, the LLM context window has limited capacity[5] to handle various sources of context.

And just as an operating system curates what fits into a CPU’s RAM, “context engineering” plays a similar role. Karpathy summarizes this well:

[Context engineering is the] ”…delicate art and science of filling the context window with just the right information for the next step.”

把LLMs类比成新的操作系统(OS),而上下文窗口(Context Window)则是LLMs的内存,内存是有限的,因此需要用一些辅助手段在磁盘、网络间去置换合适的数据到内存里,上下文窗口也是同理,在运行时需要合适的数据加载到上下文窗口内,才可以让LLMs发挥最大效果

随着LLM的流行和应用,未来的会涌现更多不同的学科, 我觉得上下文工程就是其中一个方向,是一个为LLM设计和管理输入上下文的一门新兴技术学科,可以预见,在未来的一段时间内,随着AI工程化的复杂程度提升,LLM与外界交互变多的情况下,上下文工程是一个极其重要的研究方向,可以进一步决定LLM能发挥出多大的潜力和能力

从应用到具身智能,都离不开模型对于外界信息的获取和感知,外界信息是无穷多的,如何在有限的上下文内把最有价值的信息提供给模型,决定了这个学科研究的方向

在未来,Context Engineer也许会成为AI团队中的关键角色之一,就像数据工程师之于机器学习团队那样重要

如果说Prompt是语言的编程,那么Context Engineering就是系统级调度与资源管理,决定了模型能否发挥巨大的潜力

8、上下文工程,是AI工程化时代的关键基建

随着大语言模型底层能力的不断突破,我们对如何更好地用好模型的关注也正从提示词的微调,逐渐转向对上下文的理解、管理与动态构建

Prompt Engineering是起点,Context Engineering则是让它走得更远的路。我们可以预设提示词来激发模型潜力,但能否持续发挥作用,最终还要看上下文工程能否构建出精准、动态、可扩展的输入

在未来,无论是智能体(Agent)的构建,复杂任务的编排,还是具身智能(Embodied AI)的落地,Context Engineering都会是连接模型与现实世界的桥梁它不仅是工程问题,更是产品问题、交互问题、认知问题

也许未来我们会看到一个新角色的诞生:上下文设计师(Context Architect),就像数据工程师之于机器学习,它将成为AI团队中不可或缺的一环。

这场革命,已经从写好一句提示词进入到了设计一个完整的上下文生态,也就是大行其道的Agent在做的事情和方向

那么,如何系统的去学习大模型LLM?

作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~

为什么要学习大模型?

我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着AI技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1154347.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HunyuanVideo-Foley实战手册:提升视频制作效率的AI神器

HunyuanVideo-Foley实战手册:提升视频制作效率的AI神器 随着短视频、影视内容和直播行业的爆发式增长,音效制作已成为视频生产链路中不可忽视的一环。传统音效制作依赖专业音频工程师手动匹配动作与声音,耗时耗力,尤其在大规模内…

GLM-4.6V-Flash-WEB实战案例:医疗影像辅助分析系统

GLM-4.6V-Flash-WEB实战案例:医疗影像辅助分析系统 智谱最新开源,视觉大模型。 1. 引言:AI驱动的医疗影像新范式 1.1 医疗影像分析的现实挑战 在现代临床诊疗中,医学影像(如X光、CT、MRI)是疾病诊断的核心…

AI手势识别与追踪模型轻量化:移动端适配实战

AI手势识别与追踪模型轻量化:移动端适配实战 1. 引言:AI 手势识别与追踪的现实价值 随着人机交互技术的不断演进,非接触式交互正逐步成为智能设备的重要入口。从智能家居控制到AR/VR操作,再到车载系统手势导航,AI驱动…

2026年运维工程师想转行,有什么好的建议?

2025年运维工程师想转行,有什么好的建议? 在IT行业快速迭代的今天,运维工程师站在职业生涯的十字路口。面对云原生、自动化、DevOps等技术浪潮的冲击,不少运维同仁开始思考:是坚守阵地深耕细作,还是开辟新…

AI人脸隐私卫士与Adobe插件集成设想:PS自动打码

AI人脸隐私卫士与Adobe插件集成设想:PS自动打码 1. 背景与需求分析 随着社交媒体和数字内容的爆发式增长,个人隐私保护问题日益突出。在图像处理场景中,人脸信息作为最敏感的生物特征之一,极易在无意间被泄露。尤其是在新闻编辑…

3 分钟搭专业文档站!Docsify+cpolar,笔记、教程外网随时看

Docsify 是一款轻量级文档网站生成工具,能直接将 Markdown 文件转换成带目录、搜索、代码高亮的在线文档,无需构建编译,修改后保存即生效。它适合技术团队维护 API 手册、教师整理课程资料、个人搭建学习笔记库,优点是零配置上手快…

MediaPipe Hands模型部署大全:所有平台覆盖

MediaPipe Hands模型部署大全:所有平台覆盖 1. 引言:AI 手势识别与追踪的现实价值 随着人机交互技术的不断演进,手势识别正逐步成为智能设备、虚拟现实(VR)、增强现实(AR)和智能家居等场景中的…

AI人脸隐私卫士镜像免配置部署:WebUI一键启动详细步骤

AI人脸隐私卫士镜像免配置部署:WebUI一键启动详细步骤 1. 背景与需求分析 在数字化时代,图像和视频内容的传播日益频繁,但随之而来的是个人隐私泄露风险的急剧上升。尤其是在社交媒体、公共展示或数据共享场景中,未经处理的人脸…

通俗解释PCB生产流程中的层压技术原理

层压,才是PCB真正的“粘合剂”——从一块板子的诞生讲起你有没有想过,手机主板上那些密密麻麻、纵横交错的线路,到底是怎么“叠”在一起的?它们可不是简单地贴在表面,而是被牢牢“封印”在一层又一层的绝缘材料中。这个…

Qwen3-VL-2B-Instruct性能优化:让视觉识别速度提升3倍

Qwen3-VL-2B-Instruct性能优化:让视觉识别速度提升3倍 1. 引言:为何需要对Qwen3-VL-2B-Instruct进行性能优化? 随着多模态大模型在图像理解、文档解析、GUI操作等场景中的广泛应用,推理延迟和资源消耗成为制约其落地的关键瓶颈。…

输入新品宣传方案的不同渠道和投放成本,自动统计各渠道的转化率,选出最优宣传渠道。

下面我将为你提供一个完整的、基于Python的“新品多渠道营销效果分析与最优渠道推荐器”程序,并包含你要求的所有部分。1. 项目概述项目名称: ChannelOptima - 新品多渠道营销效果分析与最优渠道推荐器项目目标: 本程序旨在帮助市场营销团队在…

HY-MT1.5-1.8B部署避坑指南:从安装到实战全流程解析

HY-MT1.5-1.8B部署避坑指南:从安装到实战全流程解析 在AI模型日益普及的今天,如何高效、稳定地部署一个高性能机器翻译模型成为开发者关注的核心问题。腾讯混元团队推出的 HY-MT1.5-1.8B 模型,凭借其1.8B参数量下的卓越表现和轻量化设计&…

手势识别技术前沿:MediaPipe Hands最新进展解读

手势识别技术前沿:MediaPipe Hands最新进展解读 1. 引言:AI 手势识别与追踪的技术演进 1.1 从交互革命到无接触感知 随着人机交互方式的不断演进,传统触控、语音指令已无法满足日益增长的沉浸式体验需求。手势识别作为自然用户界面&#x…

AI手势识别在直播带货中的应用:虚拟主播控制案例

AI手势识别在直播带货中的应用:虚拟主播控制案例 1. 引言:AI驱动的交互革命正在改变直播生态 随着直播电商的迅猛发展,传统“真人出镜手动操作”的带货模式正面临效率瓶颈。观众互动延迟、主播操作分心、场景切换生硬等问题日益凸显。在此背…

x64dbg反汇编窗口使用深度剖析

x64dbg反汇编窗口实战精讲:从入门到高效逆向的核心引擎 你有没有过这样的经历?面对一个加壳的二进制程序,IDA静态分析像雾里看花,函数边界模糊、控制流断裂,而当你把它拖进 x64dbg ,按下“运行”&#xf…

AI人脸隐私卫士参数详解:高斯模糊半径的配置

AI人脸隐私卫士参数详解:高斯模糊半径的配置 1. 引言:智能打码背后的技术权衡 在数字影像日益普及的今天,人脸隐私泄露风险正成为公众关注的焦点。无论是社交媒体分享、监控视频发布,还是企业宣传照处理,如何在保留图…

AI手势识别部署教程:环境配置与常见问题解决

AI手势识别部署教程:环境配置与常见问题解决 1. 引言 1.1 学习目标 本文将带你从零开始,完整部署一个基于 MediaPipe Hands 模型的 AI 手势识别系统。你将学会如何配置运行环境、启动 WebUI 服务,并解决在实际使用中可能遇到的各类问题。最…

基于W5500的轻量级TCP/IP协议栈完整指南

用W5500打造嵌入式系统的“网络外挂”:不靠MCU算力,也能稳如磐石地联网你有没有遇到过这样的场景?手头的STM32F103资源已经捉襟见肘,RAM还剩不到4KB,却突然要加个以太网功能——上传传感器数据、远程配置参数。一查资料…

MediaPipe Pose环境部署:从安装到运行的完整流程

MediaPipe Pose环境部署:从安装到运行的完整流程 1. 引言 1.1 AI 人体骨骼关键点检测 随着人工智能在计算机视觉领域的深入发展,人体姿态估计(Human Pose Estimation)已成为智能健身、动作捕捉、虚拟现实和安防监控等场景的核心…

小白也能懂:AI手势识别镜像的WebUI使用全攻略

小白也能懂:AI手势识别镜像的WebUI使用全攻略 1. 引言:为什么你需要本地化手势识别? 在人机交互、虚拟现实、智能监控等前沿领域,手势识别正成为连接人类意图与数字世界的桥梁。传统方案多依赖云端API(如百度人体分析…