RAG is really dead? 大模型和知识之间的桥梁没了? - spader

news/2025/9/29 10:52:56/文章来源:https://www.cnblogs.com/spader-ai/p/19118324

作者:SpaderMan

从 RAG 到上下文工程:理性思考 AI 应用开发,以交付业务结果为目标

最近,Latent Space 播客发布了一期标题为["RAG 已死,上下文工程为王"](https://www.latent.space/p/chroma ""RAG 已死,上下文工程为王"")的访谈,其中开源向量数据库 Chroma 的创始人 Jeff Huber 的观点引发了广泛讨论。这个观点触及了一个核心问题:我们是否真的理解自己在构建什么?

理解 RAG:概念与争议

RAG(Retrieval Augmented Generation,检索增强生成)是当前 AI 应用的主流技术架构。其核心思想是:当大语言模型需要回答问题时,先从外部知识库检索相关信息,将这些信息加入到提示词中,最后生成答案。

这个架构解决了大语言模型(LLM)的两个固有问题:知识的时效性和准确性。模型不再依赖训练时的静态知识,而是能够动态获取最新、最相关的信息。

然而,Jeff Huber 对"RAG"这个术语的观点值得我们思考:

"We never use the term RAG. I hate the term RAG... Are three concepts put together into one thing? Like, that's just really confusing."

他的核心观点是:RAG 这个缩写将检索(Retrieval)、增强(Augmented)、生成(Generation)三个独立且复杂的环节简单组合到了一起。这种"概念打包"带来的副作用使许多开发者误认为搭建了向量检索就算实现了 RAG,而忽略了每个环节都需要的精心设计和优化。

上下文工程(Context Engineering)的本质

Jeff Huber 提出的上下文工程定义:

"Context engineering is the job of figuring out what should be in the context window for any given LLM generation step."

上下文工程关注的核心问题是:在有限的上下文窗口中,如何选择和组织最相关的信息,以获得最佳的生成效果。

这个概念的提出基于一个重要发现——上下文腐烂(Context Rot)。Chroma 的研究表明,大语言模型(LLM)的性能并非随上下文长度线性提升。相反,当上下文包含过多信息时,模型的注意力会分散,推理能力会下降。即使是拥有百万 token 窗口的模型,最佳性能往往出现在 2000-5000 tokens 的范围内。

这个发现颠覆了"信息越多越好"的直觉。上下文工程的核心挑战就在于此:如何在信息充分性和信息过载之间找到最佳平衡点。

RAG 与上下文工程:对立还是互补

表面上看,RAG 和上下文工程似乎是对立的概念。但深入分析后,我们认为它们代表了同一问题的不同层次:

RAG 是架构层面的解决方案。它定义了一个清晰的系统结构:外部知识库、检索机制、生成模型。这个架构本身是合理且有效的。

上下文工程是实现层面的优化方法论。它不否定 RAG 架构,而是深化了对"增强"环节的理解。当我们的关注点从'如何检索信息'转向'如何组织信息'时,实际上是在做更精细的工程优化。

这种关系类似于"算法"与"工程"的关系。算法提供理论框架,工程关注实际效果。RAG 告诉我们"要检索",上下文工程告诉我们"如何更好地利用检索结果"。

超越概念之争

这场讨论的价值不在于判定 RAG 或上下文工程孰优孰劣,而在于它促使我们重新思考 AI 应用开发的方法论。

第一,警惕概念简化。当复杂系统被简化为流行词汇时,实践者容易陷入表面理解。真正的工程能力体现在对每个组件的深入理解和精细优化。

第二,重视工程思维。Jeff 反复强调要让 AI 开发"更像工程,更少像炼金术"。这意味着建立可测量的目标、可重复的流程、可验证的改进。

第三,平衡理论与实践。RAG 提供了有用的概念框架,上下文工程强调了实践优化。两者结合才能构建真正可用的系统。

结语: 从概念验证到工程优化

"RAG 已死"更像是一种警示,其真正含义是:粗糙的、教条的 RAG 实践需要进化。上下文工程不是要替代 RAG,而是让 RAG 变得更加精细和有效。

无论是 RAG 还是上下文工程,本质都是在有限的计算资源下,为 AI 提供最有用的信息。名词会变,但工程师解决问题的使命不变。真正的进步,是让每一个 token 都有价值,让每一次推理都更精准。

这场讨论的最大意义在于:它提醒我们,AI 应用正在从"能跑"走向"跑得好",从概念验证走向工程优化。这是整个行业走向成熟的标志。

关于 Spader.AI

Spader.AI,北京与星以舟智能科技有限公司,是一支专注于人工智能与云计算技术的创新团队,致力于推动前沿技术的发展和实际应用。
我们构建高性能、可扩展的 AI 基础设施,提供灵活、安全的智能解决方案,帮助企业轻松应对复杂计算任务,加速 AI 应用落地。我们相信,智能技术应当开放、可及,并真正创造价值。因此,我们不断优化算法与架构,以提升算力效率、降低使用门槛,让人工智能成为推动产业升级的重要驱动力。

如果您对高性价比算力、大模型训练训练及推理以及相关业务场景的技术感兴趣,或者对本篇分享中提到的某些观点有自己的见解希望讨论,扫码秒加 SpaderMan 客服,SpaderMan 会带您入群,和各领域技术大佬共同探讨最前沿的 AI 技术。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/921712.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

.NET操作Excel:高效材料读写与批量运行

.NET操作Excel:高效材料读写与批量运行pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Mo…

【深度解析】从零构建体育数据流水线:足球与篮球数据接入实战

【深度解析】从零构建体育数据流水线:足球与篮球数据接入实战不止于兴趣,更是技术实践 作为一名开发者兼体育爱好者,我始终对数据驱动体育的世界着迷。但不同于普通观众,我们更关心的是:这些数据如何通过技术手段…

Qwen-Image技术报告

原文:https://mp.weixin.qq.com/s/GLEa3fIc67uX9IK50LDeNw 全文摘要本文介绍了一种名为Qwen-Image的图像生成基础模型,它在复杂文本渲染和精确图像编辑方面取得了显著进展。为了解决复杂文本渲染的挑战,作者设计了一…

苏州相城区网站建设渭南市工程建设项目审批网上办事大厅

✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。 🍎个人主页:小嗷犬的个人主页 🍊个人网站:小嗷犬的技术小站 🥭个人信条:为天地立心&…

wordpress全站ajax用wordpress仿a站

中介者模式 中介者模式 中介者模式 介绍:用一个中介对象来封装一系列的对象交互,中介者使各对象不需要显式地相互引用,从而使其耦合松散,而且可以独立地改变它们之间的交互。 实现:抽象中介者类,定义一个…

服装设计网上自学课程宁波网站搜索引擎优化

以下文字是钱学森在1990年给汪成为院士的信中对虚拟现实技术的科学意义和未来发展给与的思考和建议,他也提出可以将虚拟现实技术成为灵境技术。

IOS-和安卓-AR-游戏开发指南-全-

IOS 和安卓 AR 游戏开发指南(全)原文:zh.annas-archive.org/md5/eaf1b154611090aa6422cd5e3d6dc2fc 译者:飞龙 协议:CC BY-NC-SA 4.0前言 在本书中,我们将介绍增强现实及其如何使用强大而简单的工具实现。利用 V…

Winform/C# 输出到Release VS中Release模式下生成去掉生成pdb文件

前几天发布项目,有时候就发布那几个dll,但是一个dll同时还有一个pdb文件,而且pdb文件貌似还挺大。 pdb文件包含了编译后程序指向源代码的位置信息,用于调试的时候定位到源代码,主要是用来方便调试的. 在程序发布为r…

成都响应网站建设网站文章标题

一、实验内容与目的 实验要求: 利用CP226实验仪上的小键盘将程序输入主存储器EM,通过指令的执行实现微程序控制器的程序控制。 实验目的: 1.掌握模型机的操作码测试过程; 2.掌握模型机微程序控制器的基本结构以及程序控制的基本原…

表格上传网站建设网游小说

1. 引言 在任何编程语言中,错误处理都是一个至关重要的部分。在 Go 语言中,错误处理方式独具特色,它并没有采用异常处理机制(try-catch),而是通过显式的错误返回值来处理错误。这种方式让代码更加明确、易于维护,也使得错误处理更加透明。 在这篇博客中,我们将深入探…

做外贸好的网站有哪些百度识图在线

目录 0、基本信息1、研究动机2、创新点2.1、核心思想:2.2、思想推导: 3、准备3.1、符号3.2、互信息3.3、JS散度3.4、Deep InfoMax方法3.5、判别器:f-GAN估计散度 4、具体实现4.1、局部-全局互信息最大化4.2、理论动机 5、实验设置5.1、直推式…

校园二手网站开发与设计任务书行政单位单位网站建设

1.实现一个纵横字谜 2.支持14x14的网格 3.可以查看答案 4.猜测错误会提示答案信息 5.从txt读取词汇 6.每次游戏开始 随机生成纵横字谜 n’h

网站推他网站wordpress教程登陆

1.为什么要有缓冲区 缓冲区分成语言层面的缓冲区和操作系统层面的缓冲区 先说结论,语言的缓冲区可以减少系统调用的次数进而提高向文件写入和读取的效率。 2.举例子 向屏幕打印,无非就是向屏幕这个文件的缓冲区写入,然后在由操作系统刷新…

重庆工程建设信息网站4399谁做的网站

log函数是指数函数y bx 的反函数,用于求数字以某个数为底的对数。log函数的定义:设b>0,b≠1,对于任意实数x > 0,如果存在唯一的实数y,使得 b^y x,则称y为以b为底x的对数,记为:y log_b(x)这里b称为对数的底数。对数运算的底数通常取10和e。常见的对数运算有:1. 常用对数…

公司核名在哪个网站网站提交搜索引擎后出现问题

作者:Zarten知乎专栏:Python爬虫深入详解知乎ID: Zarten简介: 互联网一线工作者,尊重原创并欢迎评论留言指出不足之处,也希望多些关注和点赞是给作者最好的鼓励 !介绍MongoDB是一种面向文档型的…

供应商协同平台:打造高效安全供应链的关键

供应商协同平台通过整合技术资源,解决了传统供应链中文件传输混乱、数据更新延迟、安全管控薄弱等问题。结合“Ftrans B2B企业间⽂件安全交换系统”的加密传输与权限管理功能,平台实现了设计图纸、订单数据等关键信息…

互斥锁和信号量机制

互斥锁 特性: 1.需要忙等,进程时间片用完才下处理机,违反让权等待 2.优点:等待奇迹不用切换进程上下文,多处理机系统中,若上锁的时间短,则等待的代价很低 3.常用于多处理机,一个核忙等,其他核照常工作,并快速…

NSIS为当前用户安装和为所有用户安装的选择

一、为当前用户和所有用户安装选择 确定 NSIS 脚本中应使用 SetShellVarContext all 还是 current,主要取决于你的软件安装目标和用户访问需求。可以通过以下几个核心问题来判断: 1. 软件是否需要被系统中所有用户访…

在 Unity 中运用 SoundTouch 插件控制音频倍速播放

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

网站的商桥怎么做国内产品设计公司前十名

内容管理模块 - 课程预览、提交审核 文章目录 内容管理模块 - 课程预览、提交审核一、课程预览1.1 需求分析1.2 freemarker 模板引擎1.2.1 Maven 坐标1.2.2 freemaker 相关配置信息1.2.3 添加模板 1.3 测试静态页面1.3.1 部署Nginx1.3.2 解决端口问题被占用问题1.3.3 配置host文…