# 不会上下文工程,还敢说自己是大模型开发者?小白也能秒变AI大神的全攻略

最近在做Deepresearch以及刷到一个不错的文章:context-engineering-guide,这篇文章揭示了提示工程以及上下文过程在智能体应用开源流程中,包括Deepresearch,MCP在内的一些概念,起到了非常重要的作用!

Context Engineering与Prompt Engineering的关系与区别

在深入探讨Context Engineering之前,我们需要理解它与Prompt Engineering的关系。传统的Prompt Engineering主要关注如何设计和优化单次的提示指令,让AI模型更好地理解用户意图并产生期望的输出。这就像是学会如何向一个专家提出精确的问题,通过精心设计的问题描述、示例和格式要求来获得高质量的回答。

而Context Engineering则是一个更加宽泛和系统性的概念,它不仅包含了Prompt Engineering的所有技巧,还扩展到了整个AI系统的上下文管理。如果说Prompt Engineering是"问话的艺术",那么Context Engineering就是"环境构建的科学"。它关注的是如何为AI系统提供完整的工作环境,包括背景知识、历史记录、工具调用、数据检索等各个方面,让AI在这个精心构建的上下文环境中更好地完成复杂任务。

什么是上下文工程?

几年前,包括许多顶尖的人工智能研究人员在内,不少人声称Prompt Engineering将会消亡。然而事实证明,他们的预测完全错误。Prompt Engineering不仅没有消失,反而变得比以往任何时候都更加重要,重要到正在被重新命名为Context Engineering。

Context Engineering是一个用来描述如何调整大型语言模型执行任务所需的指令和相关上下文的重要过程的术语。已经有很多业界专家对此进行了讨论,包括Ankur Goyal、Walden Yan、Tobi Lutke和Andrej Karpathy等人都曾提及这个概念的重要性。

人们之所以怀疑Prompt Engineering是一项严肃技能,主要是因为许多人将其与"盲目提示"混淆了。盲目提示是指在ChatGPT这样的LLM中使用简短的任务描述,仅仅是简单地向系统提问。而真正的Prompt Engineering需要更仔细地思考提示的上下文和结构,或许从一开始,它就应该叫做Context Engineering。

从开发者的角度来看,Context Engineering是一个迭代过程,用于优化提供给LLM的指令和上下文,以达到期望的结果。这包括建立正式的流程,如评估管道,用来衡量策略是否有效。

Context Engineering的核心定义

考虑到人工智能领域的快速发展,我们可以采用一个更宽泛的Context Engineering定义:**设计和优化提供给大型语言模型和高级AI模型的指令及相关上下文的过程,以使其能够有效地执行任务。**这不仅包括基于文本的LLM,也涵盖了为日益普及的多模态模型优化上下文。

Context Engineering包括但不限于以下几个方面:设计和管理提示链、调整指令和系统提示、管理提示中的动态元素(如用户输入、日期时间等)、搜索和准备相关知识(即RAG检索增强生成)、查询增强、工具定义和指令(对于智能体系统而言)、准备和优化少样本示例、结构化输入和输出、短期记忆管理以及长期记忆检索等。

换言之,Context Engineering的目标就是优化在LLM上下文窗口中提供的信息,同时过滤掉噪声信息。这本身就是一门科学,因为它需要系统地衡量LLM的性能表现。

Context Engineering的实践应用

系统提示的设计与优化

让我们通过一个具体的例子来看Context Engineering在实际中的应用。笔者最近为一个个人使用的多智能体深度研究应用做了一些上下文工程工作。在这个应用中,Search Planner(搜索规划师)智能体负责根据用户查询生成搜索计划。

以下是为这个子智能体整理的系统提示:

你是一位专业的研究规划师。你的任务是将复杂的研究查询(由<user_query></user_query>分隔)分解为具体的搜索子任务,每个子任务关注不同的方面或来源类型。当前日期和时间是:{{ $now.toISO() }}对于每个子任务,请提供:1. 子任务的唯一字符串ID(例如,'subtask_1', 'news_update')2. 专注于主查询某个方面的具体搜索查询3. 要搜索的来源类型(web, news, academic, specialized)4. 时间段相关性(today, last week, recent, past_year, all_time)5. 领域重点(如果适用)(technology, science, health等)6. 优先级级别(1-最高到5-最低)所有字段(id, query, source_type, time_period, domain_focus, priority)对每个子任务都是必需的,除了time_period和domain_focus如果不适用可以为null。创建2个子任务,这些子任务一起提供对主题的全面覆盖。重点关注不同的方面、观点或信息来源。

在这个系统提示中,有很多部分都需要仔细考虑,为规划智能体提供精确的上下文,使其能够有效地执行任务。这不仅仅是设计一个简单的提示或指令,而是需要反复试验,并提供重要的上下文,以便模型能够最佳地执行任务。

指令层面的上下文工程

指令是提供给系统的高层指示,精确告诉系统要完成什么任务。例如:“你是一位专业的研究规划师。你的任务是将复杂的研究查询分解为具体的搜索子任务,每个子任务关注不同的方面或来源类型。”

很多初学者甚至是经验丰富的AI开发者可能就止步于此了。但从完整的提示来看,我们需要给系统提供大量额外的上下文,才能让它按照我们的意愿工作。这正是Context Engineering的意义所在:它通过告知系统更多关于问题范围和具体需求的细节,来引导系统的行为。

用户输入的结构化处理

用户输入虽然在系统提示中没有直接显示,但需要进行结构化处理。例如:

<user_query> What's the latest dev news from OpenAI? </user_query>

这里使用了分隔符,这是为了更好地结构化提示。这对于避免混淆非常重要,能够清晰地界定用户输入是什么,以及希望系统生成什么内容。有时候,输入的内容和希望模型输出的信息是相关的,比如查询是输入,而子查询是输出。

结构化输入与输出的优化

除了高层指令和用户输入之外,还需要花相当大的精力来详细描述智能体需要生成的内容结构。以下是提供给规划智能体的详细指令,以便它根据用户查询创建子任务:

对于每个子任务,请提供:1. 子任务的唯一字符串ID(例如,'subtask_1', 'news_update')2. 专注于主查询某个方面的具体搜索查询3. 要搜索的来源类型(web, news, academic, specialized)4. 时间段相关性(today, last week, recent, past_year, all_time)5. 领域重点(如果适用)(technology, science, health等)6. 优先级级别(1-最高到5-最低)所有字段(id, query, source_type, time_period, domain_focus, priority)对每个子任务都是必需的,除了time_period和domain_focus如果不适用可以为null。创建2个子任务,这些子任务一起提供对主题的全面覆盖。重点关注不同的方面、观点或信息来源。

仔细观察上面的指令,笔者列出了希望规划智能体生成所需信息的清单,并提供了一些提示和示例,以便更好地引导数据生成过程。这对于向智能体提供关于预期的额外上下文至关重要。例如,如果不告诉它优先级级别应该在1-5的范围内,系统可能会倾向于使用1-10的范围。

为了从规划智能体那里获得一致的输出,还需要提供关于子任务格式和期望字段类型的信息作为上下文:

每个子任务将包含以下信息:id: strquery: strsource_type: str # 例如,"web", "news", "academic", "specialized"time_period: Optional[str] = None # 例如,"today", "last week", "recent", "past_year", "all_time"domain_focus: Optional[str] = None # 例如,"technology", "science", "health"priority: int # 1(最高)到5(最低)

这种结构化输出的方法是Context Engineering中一个被许多AI开发者忽略的重要方面。这是一种非常强大的方法,尤其当智能体产生的输出不稳定,而它们又需要按照特定的格式传递给工作流中的下一个组件时。

工具集成与动态上下文

在构建智能体系统时,工具的集成是Context Engineering的重要组成部分。例如,将当前日期和时间作为上下文传入是非常重要的,这可以通过简单的函数调用实现:

The current date and time is: {{ $now.toISO() }}

这样的工具调用有助于增加动态性,即仅在查询需要时获取相关信息。这就是Context Engineering的意义所在——它迫使开发者对"向LLM传递什么样的上下文"以及"何时传递"做出具体的决策。这很重要,因为它消除了应用程序中的假设和不准确性。

日期和时间对于系统而言是重要的上下文,否则它在处理需要了解当前日期和时间的查询时往往表现不佳。例如,如果要求系统搜索上周发生的OpenAI最新开发者新闻,它可能会随意猜测日期和时间,从而导致次优的查询,最终搜索结果也不准确。

RAG与记忆管理

RAG(检索增强生成)和记忆管理是Context Engineering中的高级技术。虽然在基础版本中可能不需要使用短期记忆,但可以构建一个版本来缓存针对不同用户查询的子查询。这有助于加速和优化工作流。如果用户之前已经使用了类似的查询,可以将这些结果存储在向量数据库中,并查询这些结果,从而避免为已经生成并存在于向量数据库中的计划重新创建一组子查询。

这是一种巧妙的Context Engineering应用,它使应用程序更具动态性、更经济、效率更高。Context Engineering不仅仅是优化提示,更是根据设定的目标选择合适的上下文。在如何维护向量数据库以及如何将这些现有子任务拉入上下文方面,还有更多创意空间。富有创造性和新颖的Context Engineering才是真正的技术护城河。

状态与历史上下文管理

在复杂的智能体系统中,状态和历史上下文管理是一个重要组成部分。系统可能需要修订全部或部分查询、子任务,甚至是从网络搜索API获取的数据。这意味着系统将需要多次尝试解决问题,并且需要访问先前的状态以及系统可能的所有历史上下文。

对于实际应用而言,这意味着智能体需要访问子任务的状态、修订情况、工作流中每个智能体过去的结果,以及帮助进行修订阶段所需的任何其他上下文。对于这种类型的上下文,传递什么取决于正在优化的目标。这里需要做出大量的决策。Context Engineering并不总是直接了当的,这个组件需要经过多次迭代才能达到最佳效果。

最后我们看一个Deep Research的智能体例子,下图展示了如何从简单指令扩展到包含时间context、输出格式、字段定义的完整系统。Context engineer需要系统思维,精确定义每个组件,动态管理变化因素,持续优化效果。这已成为AI开发的关键技能。

图片来源:https://x.com/ProgramerJohann/status/1942241296351105528/photo/1

高级Context Engineering技术

在Context Engineering中还有许多高级技术有待探索,包括上下文压缩、上下文管理技术、上下文安全和有效性评估等。这些技术主要用于衡量上下文随时间的有效性。上下文可能会被稀释或变得低效,即充斥着过时和不相关的信息,这需要专门的评估工作流来捕获这些问题。

上下文压缩技术能够在保持关键信息的同时减少上下文长度,这对于处理长文档或大量历史记录特别重要。上下文管理技术则涉及如何动态地添加、删除和更新上下文中的信息,以确保系统始终拥有最相关和最新的信息。

上下文安全是另一个重要方面,它涉及如何防止恶意或错误的上下文信息影响系统的行为。这包括对输入的验证、对上下文来源的审核以及对输出的监控等。

Context Engineering的未来发展

Context Engineering将继续演变为AI开发者和工程师的一项重要技能集合。除了手动进行Context Engineering,还有机会构建能够自动化处理有效上下文工程的方法。目前已经有一些工具尝试做到这一点,但这个领域还需要更多的进展。

自动化Context Engineering可能包括智能的上下文选择、动态的上下文优化、基于性能反馈的上下文调整等。这些技术的发展将使Context Engineering更加高效和可扩展,同时降低开发者的工作负担。

随着AI模型能力的不断增强和应用场景的日益复杂,Context Engineering的重要性只会越来越突出。它不仅是一个技术问题,也是一个设计问题,需要开发者具备深入的领域知识和丰富的实践经验。

结语

Context Engineering代表了从简单的提示工程向全面的上下文管理的演进。它不仅包含了传统Prompt Engineering的所有技巧,还扩展到了整个AI系统的环境构建和优化。通过系统性的上下文设计、结构化的输入输出管理、工具集成、记忆管理和状态维护,Context Engineering为构建高效、可靠的AI应用提供了强大的技术支撑。

对于AI开发者而言,掌握Context Engineering技能已经变得至关重要。它不仅能够显著提升AI系统的性能和可靠性,还能够为复杂的AI应用场景提供更好的解决方案。随着AI技术的不断发展,Context Engineering必将成为AI开发领域的核心竞争力之一。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1169503.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

广州一日游大致安排

广州一日游大致安排🌅 08:00 抵达广州东站 → 早餐(步行 5–10 分钟) 广州东站周边就是天河区核心,美食密度极高。 推荐早餐(任选其一)点都德(林和中路店) 经典广州早茶,离广州东很近 推荐:虾饺皇、凤爪、肠…

【AI技术yyds】百度搜索新范式、多智能体协作...信息检索领域最新研究成果全解析,开发者必看!从AI搜索到多模态推荐,一篇搞定所有前沿技术!

信息检索领域前沿研究观察&#xff1a;从AI搜索到多模态推荐 最近在信息检索领域看到了不少有意思的研究进展&#xff0c;从百度搜索提出的AI搜索范式到各种新颖的检索增强方法&#xff0c;这些工作都在试图解决当前搜索和推荐系统面临的实际问题。今天想和大家分享一下这些研究…

从排行榜看行业标杆:2026年液压拉力试验机/液压万能试验机十大品牌TOP4综合评测 - 品牌推荐大师1

液压拉力/万能试验机是现代工业与科研中用于测定金属、非金属、复合材料等力学性能的关键设备,广泛应用于航空航天、汽车制造、建筑工程、新材料研发及高等院校等众多领域。随着“中国制造2025”的深入推进与产业升级…

2026年 景观鱼池工程厂家推荐榜单:专业设计/假山鱼池/生态工程,匠心打造庭院水景艺术 - 品牌企业推荐师(官方)

2026年景观鱼池工程厂家推荐榜单:专业设计/假山鱼池/生态工程,匠心打造庭院水景艺术 在现代景观设计与庭院营造中,鱼池已从传统的水体点缀演变为融合生态、艺术与技术的综合性工程。它不仅承载着美化环境、陶冶情操…

AI Agent开发天花板:LangGraph构建DeepResearch实战,代码小白也能秒会的神操作!

上一篇内容我们讲解了怎么构建DeepResearch两个比较核心的组件&#xff1a;确定用户研究范围以及研究&#xff0c;这两个组件可以大致满足用户输入研究主题或者查询&#xff0c;然后输出一个研究结果&#xff0c;不过这个对于系统来说大概率会遇到当用户查询相对复杂&#xff0…

卫星图像匹配 - MKT

卫星图像匹配 1 ISPRS2024 | 视觉语言模型 | 基于Transformer和视觉基础模型的跨视角遥感图像检索方法 A Transformer and Visual Foundation Model-Based Method for Cross-View Remote Sensing Image RetrievalarXi…

【AI新突破】DeepResearch开源:让AI自己搞研究,程序员解放了!附保姆级代码解析+实战教程[特殊字符]

引言 在人工智能快速发展的今天&#xff0c;如何构建一个能够进行深度研究、自主学习和迭代优化的AI系统成为了技术前沿的重要课题。Gemini开源的DeepResearch一周收获7.9k Star&#xff0c;Google的开源项目Gemini DeepResearch技术通过结合LangGraph框架和Gemini大语言模型&…

硬核干货 | 从原型到生产:Anthropic多智能体系统构建全攻略,性能提升90%的秘密都在这里!

Anthropic 公司在 2025 年 6 月 13 日发表了一篇名为《如何构建多智能体研究系统》的文章。 Anthropic 的研究功能利用多个 Claude 智能体&#xff08;Agent&#xff09;更高效地探索复杂主题。本文将分享在构建这个系统过程中遇到的工程挑战以及所学到的经验。 Claude 现已具…

RAG开发必看:结构化数据的5种骚操作,小白程序员也能轻松掌握

大家好&#xff01;今天来聊聊如何在RAG应用中更好地利用结构化数据。很多同学可能觉得RAG主要是处理文本文档&#xff0c;但其实结构化数据也能发挥很大作用。我总结了5种实用的方法&#xff1a; 1. 直接存储行数据 最简单直接的方式就是把数据表的每一行当作一个独立的chun…

2026年 无痕内衣品牌实力推荐榜:无缝文胸与女士内衣舒适科技深度解析,甄选优质女性内衣厂家 - 品牌企业推荐师(官方)

2026年无痕内衣品牌实力推荐榜:无缝文胸与女士内衣舒适科技深度解析,甄选优质女性内衣厂家 随着女性自我意识的觉醒与消费理念的升级,内衣市场正经历一场深刻的“舒适革命”。传统钢圈、蕾丝、缝线带来的束缚与不适…

Adam自适应学习率稳医疗模型AUC

&#x1f4dd; 博客主页&#xff1a;jaxzheng的CSDN主页 Adam自适应学习率&#xff1a;医疗AI模型AUC稳定性的关键突破目录Adam自适应学习率&#xff1a;医疗AI模型AUC稳定性的关键突破 引言&#xff1a;医疗AI性能的隐性危机 一、技术本质&#xff1a;Adam为何能“稳住”AUC&a…

API已死,模型永生?揭秘AI创业公司从“包装“到“自研“的逆袭之路,小白也能上车!

现在&#xff0c;大部分AI创业公司都是调用大厂的API来做产品。这样做目前没问题&#xff0c;但是按照历史规律&#xff0c;每家有野心的AI公司最后都会训练自己的模型——哪怕一开始只是做个简单封装的公司也不例外。为什么&#xff1f;因为训练模型的门槛正在快速下降。模型蒸…

直播录制教程如何录制高清直播回放与剪辑推荐录制软件与工具

如果你是一名直播录制爱好者&#xff0c;或者是主播在寻找更高效的直播回放录制和剪辑工具&#xff0c;那么这篇文章将为你推荐一系列适合的直播录制软件及工具。无论你是需要B站的录播姬、blrec等工具&#xff0c;还是在寻找弹幕转换、视频压制和WebHook上传等功能&#xff0c…

【爆肝整理】程序员必看!2025年大模型/AI技术50篇必读论文,不看后悔一年![特殊字符]

近年来&#xff0c;AI工程领域发展迅猛&#xff0c;各种新技术层出不穷。对于想要在这个领域深耕的工程师来说&#xff0c;掌握核心知识显得尤为重要。本文整理了AI工程10个关键方向的50篇必读论文和资源&#xff0c;涵盖大语言模型(LLM)、基准测试、提示工程(Prompting)、检索…

新电脑一些常用设置

1、设置F2为重命名键 &#xff08;fnesc&#xff09;&#xff0c;就开启了f1-f12系统默认快捷键模式。

2026年GEO源代码源头哪家靠谱?品质之选汇总 - 源码云科技

2026年GEO源代码源头哪家靠谱?品质之选汇总2026年AI搜索风口全面爆发,GEO优化已然成为企业引流获客的核心抓手,无论是互联网公司创业还是传统行业转型,找对靠谱的GEO优化源码源头都能少走无数弯路。市面上GEO优化服…

CentOS 7.9 完美部署指南:Go语言环境搭建与Oracle/MySQL数据库连接全攻略

引言:为什么选择CentOS 7.9作为Go开发环境? 作为企业级Linux发行版的常青树,CentOS 7.9凭借其卓越的稳定性和长期支持,成为众多开发者和企业的首选服务器操作系统。当我们将现代化的Go语言与CentOS 7.9结合,特别是需要连接Oracle和MySQL这两种在企业中广泛使用的数据库时…

2026年优质GEO系统源码源头盘点,稳定可靠之选 - 源码云科技

2026年优质GEO系统源码源头盘点,稳定可靠之选随着AI搜索用户规模突破5.15亿,GEO优化早已不是营销圈的新鲜词,而是企业抢占算法流量的核心抓手。2026年GEO优化市场规模预计飙升至30亿元,同比暴涨11000%,越来越多创…

2026年 高低温实验箱厂家推荐榜单:恒温恒湿/交变实验箱品牌深度解析,精准控温与耐久品质之选 - 品牌企业推荐师(官方)

2026年高低温实验箱厂家推荐榜单:恒温恒湿/交变实验箱品牌深度解析,精准控温与耐久品质之选 在现代工业制造、科研实验与产品质量验证领域,环境可靠性测试已成为不可或缺的关键环节。高低温实验箱、恒温恒湿实验箱及…

实战:高级中文自然语言处理系统的Python设计与实现 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …