程序员必学收藏:RAG应用架构全解析,从基础流程到模块化演进,一篇掌握大模型检索增强生成技术

本文详细介绍了RAG应用的经典架构与流程,包括数据索引(加载、分割、嵌入、索引)和数据查询(检索、生成)阶段,以及检索前处理与后处理等扩展阶段。分析了RAG面临的五大挑战:检索精确度、大模型抗干扰能力、上下文窗口限制、RAG与微调选择、响应性能问题。最后探讨了RAG架构从Naive RAG到Advanced RAG再到Modular RAG的演进历程,展示了技术向灵活模块化方向发展的趋势。

一、RAG 应用的经典架构与流程

在了解了 RAG 的一些基本概念与简单的应用场景后,我们从技术层来看一个最基础、最常见的 RAG 应用的逻辑架构与流程。注意:在这张图中仅展示了一个最小粒度的 RAG 应用的基础原理,而在当今的实际 RAG 应用中,对于不同的应用场景、客观条件、工程要求,会有更多的模块、架构与流程的优化设计。

在通常情况下,可以把开发一个简单的 RAG 应用从整体上分为数据索引 ( Indexing )与数据查询( Query )两个大的阶段,在每个阶段都包含不同的处里阶段。这些主要的阶段用如下图表示:

1.1、数据索引阶段

既然RAG的核心之一是通过"检索"来增强生成,那么首先需要准备可以检索的内容。在传统的计算机检索技术中,最常用的是基于关键词的检索,比如传统的搜索引擎或者关系数据库,通过关键词的匹配程度来对知识库中的信息进行精确或模糊的检索,计算相关性,按照相关性的排序输出,但是在大模型的RAG应用中,最常见的检索方式是借助基于向量的语义检索来获得相关的数据块,并根据其相似度排序,最后输出最相关的前K个数据块(简称 top_K )。因此,向量存储索引就成了RAG应用中最常见的索引形式。

向量是一种数学表示方法,它将文本、图像、音频等复杂信息转换为高维空间中的点,每个维度都代表一种特征或属性。这种转换使得计算机可以理解和处理这些信息,因为它们都是连续的多个数值。向量保留了词汇之间的语义关系。例如,相似的词在向量空间中距离较近,这样就可以进行语义相似度计算或进行聚类分析。

自然语言处理中用于把各种形式的信息转换成向量表示的模型叫嵌入模型。

基于向量的语义检索就是通过计算查询词与已有信息向量的相似度(如余弦相似度),找出与查询词在语义上最接近的信息。

数据索引阶段通常包含以下几个关键阶段。

(1)加载( Loading ): RAG应用需要的知识可能以不同的形式与模态存在,可以是结构化的、半结构化的、非结构化的、存在于互联网上或者企业内部的、普通文档或者问答对。因此,对这些知识,需要能够连接与读取内容。

(2)分割( Splitting ):为了更好地进行检索,需要把较大的知识内容(一个 Word / PDF 文档、一个 Excel 文档、一个网页或者数据库中的表等)进行分割,然后对这些分割的知识块(通常称为 Chunk )进行索引。当然,这就会涉及一系列的分割规则,比如知识块分割成多大最合适?在文档中用什么标记﹣个段落的结尾?

(3)嵌入( Embedding ):如果你需要开发 RAG 应用中最常见的向量存储索引,那么需要对分割后的知识块做嵌人。简单地说,就是把分割后的知识块转换为一个高维(比如1024维等)的向量。嵌入的过程需要借助商业或者开源的嵌入模型( Embedding Model )来完成,比如 OpenAI 的text-embedding-3-small 模型。

(4)索引( Indexing ):对于向量存储索引来说,需要将嵌入阶段生成的向量存储到内存或者磁盘中做持久化存储。在实际应用中,通常建议使用功能全面的向量数据库(简称向量库)进行存储与索引。向量库会提供强大的向量检索算法与管理接口,这样可以很方便地对输入问题进行语义检索。注意:在高级的 RAG 应用中,索引形式往往并不只有向量存储索引这一种。因此,在这个阶段,很多应用会根据自身的需要来构造其他形式的索引,比如知识图谱索引、关键词表索引等。

1.2、数据查询阶段

在数据索引准备完成后, RAG 应用在数据查询阶段的两大核心阶段是检索与生成(也称为合成)。

(1)检索( Retrieval ):检索的作用是借助数据索引(比如向量存储索引),从存储库(比如向量库)中检索出相关知识块,并按照相关性进行排序,经过排序后的知识块将作为参考上下文用于后面的生成。

(2)生成( Generation ):生成的核心是大模型,可以是本地部署的大模型,也可以是基于 API 访问的远程大模型。生成器根据检索阶段输出的相关知识块与用户原始的查询问题,借助精心设计的 Prompt ,生成内容并输出结果。

以上是一个经典 RAG 应用所包含的主要阶段。随着 RAG 范式与架构的不断演进与优化,有一些新的处理阶段被纳入流程,其中典型的两个阶段为检索前处理与检索后处理。

(1)检索前处理( Pre-Retrieval ):顾名思义,这是检索之前的步骤。在一些优化的 RAG 应用流程中,检索前处理通常用于完成诸如查询转换、查询扩充、检索路由等处理工作,其目的是为后面的检索与检索后处理做必要准备,以提高检索阶段召回知识的精确度与最终生成的质量。

(2)检索后处理( Post-Retrieval ):与检索前处理相对应,这是在完成检索后对检索出的相关知识块做必要补充处理的阶段。比如,对检索的结果借助更专业的排序模型与算法进行重排序或者过滤掉一些不符合条件的知识块等,使得最需要、最合规的知识块处于上下文的最前端,这有助于提高大模型的输出质量。

二、RAG 应用面临的挑战

尽管 RAG 用一种非常简洁且易于理解的方法,在很大程度上提高了大模型在专业领域任务上的适应性,极大地增强了大模型在大量应用(特别是企业级应用)上的输出准确性,但是日益丰富的应用场景给 RAG 应用带来了更多的挑战。当然,这些挑战也是促进 RAG 应用不断出现新的架构与优化方法的动力。目前,传统的 RAG 应用面临的挑战如下。

2.1、检索召回的精确度

RAG 思想是借助临时的语义检索来给大模型补充知识"营养",以便让大模型能够更好地生成高质量结果。检索出的外部知识块足够精确与全面就是后面生成阶段的重要保障。自然语言具有天然的复杂性,检索技术具有模糊性,检索出的知识块如果带有大量的无用、噪声数据甚至矛盾的信息,就会影响大模型的生成质量。

2.2、大模型自身对抗干扰的能力

对于检索出的上下文中携带的相关的外部知识块的干扰信息、多余信息矛盾信息等,大模型需要能够尽量推理,识别与区分,并能够很好地按照Prompt进行输出,因此大模型本身的能力是影响最终生成质量的重要因素。

2.3、上下文窗口的限制

大模型存在输人和输出上下文窗口的限制(最大 token 数量)。简单地说,你与大模型一次会话的数据量是存在大小限制的。如果你需要在一个大规模约外部知识库中检索出更多的相关知识块并将其交给大模型,就可能会打破这种窗口限制从而导致失败。如何在窗口限制内尽可能多地携带更多的知识块是RAG应用开发时需要注意的常见问题之一。

2.4、RAG与微调的选择

模型微调( Fine-tuning )是一种让大模型更好地适应领域与行业环境的常见方法。与 RAG 相比,微调把垂直领域的知识变成大模型的训练语料,把生成优化的时间提前到大模型使用前,简化了应用架构。那么对于 RAG 与微词,应该如何选择、配合、协调以便最大限度地提高大模型的输出能力呢?这也是很多人经常纠结的问题之一。

2.5、响应性能问题

与大模型直接输出相比, RAG 应用无疑增加了更多的处理步骤,且随着人们对 RAG 范式的研究深入,更复杂的 RAG 范式会带来更多的处理阶段(比如需要多次借助大模型完成选代优化)。这样优化的 RAG 范式虽然会带来更优质的输出结果,但同时与端到端的响应性能下降是矛盾的。那么在一些对延迟时间较敏感的企业级应用场景中,如何兼顾最终输出的质量与较短的响应延迟时间就成了开发者的一大挑战。

三、RAG应用架构的演进

3.1、Naive RAG (朴素RAG或经典RAG)阶段

这代表了最早的经典 RAG 思想。这个阶段的 RAG 遵循传统的基础顺序流程,包含3个主要的模块与阶段:索引、检索与生成。 Naive RAG 的特点是只保留最简单的过程 Node (节点)且顺序式执行。

3.2、 Advanced RAG (高级RAG)阶段

Advanced RAG 在 Naive RAG 的基础上对索引、检索与生成这3个主要阶段进行了增强,特别是在检索阶段,增加了检索前处理与检索后处理。

3.3、Modular RAG (模块化RAG)阶段

Native RAG 与 Advanced RAG 都是链式的、顺序式的 RAG 范式,而 Modular RAG 超越了这两种传统的 RAG 范式,展示了一种更灵活、更自由、具备高度扩展性的 RAG 范式。 Modular RAG 的基本思想如下:

将 RAG 应用中的各个阶段细分成了多个模块类(代表 RAG 应用中的一个核心流程,比如预检索)、模块(代表一个核心流程中的功能模块,比如预检索中的查询转换)与算法(代表模块的一种实现方法,比如查询转换可以有普通重写、后退式重写、 HyDE 重写等)。这些模块与算法之间不再有固定的选择与顺序流程,而是由使用者根据应用场景灵活组合,构造更适合自己的 RAG 工作流。

Modular RAG 的好处是具备了极强的扩展性与灵活性。一方面,随着研究的深入和更多优化理论的出现,可以出现更多的模块与算法;另一方面,使用作流。者可以根据自身的需要灵活地组合不同的模块和算法,构造更灵活的 RAG 工来实现更复杂的 RAG 工作流,从而实现特定的优化目标。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2025 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1155403.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

找真厂,找老板,快人一步

处于B2B商业环境之中,订单的获取快慢取决于时间的利用效率,利润的多少则与信息掌握的差距紧密相关。 其实事实上,现实情况却让人感到不如意:在1688平台上,你所联络的那些所谓“源头工厂”,实际上或许仅仅是…

Linux基础自测题

写在前面 此前我们进行了十小时学会Linux的视频教学,课后给大家留下了如下习题,大家可以检验一下自己的Linux的学习成果。推荐配合我们的B站课程同步食用:https://www.bilibili.com/video/BV1hT411F7r7/ 更多教程可见生信Linux及服务器使用技…

大模型学习必备!腾讯优图RAG技术架构详解:从Embedding到Agentic RAG的进阶之路

腾讯优图实验室RAG技术架构包含语义检索(多阶段训练Embedding模型、Reranker模型)、结构化信息检索(Text2SQL技术)和GraphRAG框架三大部分。通过多阶段训练管线、精细化数据工程、分层知识蒸馏等技术提升检索效果;融合Text2SQL实现结构化数据查询;自研Gr…

档案保存环境优化:温湿度精准感知与智能调控系统实施方案

原标题:档案馆自动化温湿度监控系统实施方案档案布局图一、项目背景与目标(一)项目背景档案馆作为承载历史文献、重要档案的核心场所,档案资料(如纸质档案、电子档案载体、实物档案等)对温湿度环境具有极高…

收藏!Java开发者转型大模型开发全指南:优势+路径+实践心得

在AI技术席卷全球的当下,大模型开发已然成为技术领域的“黄金赛道”。作为一名深耕Java后端多年的开发者,我经常在技术社区被问到:“传统后端开发者能搭上AI快车吗?”我的答案始终坚定:不仅能,Java开发者的…

智能联动 + 数据可溯:以太网温湿度记录仪赋能档案馆 “八防” 精细化管理

原标题:以太网温湿度记录仪:筑牢档案馆 “八防” 安全防线的核心支撑八防十防档案馆作为历史文化遗产与重要信息资源的存储载体,“八防”(防火、防盗、防潮、防虫、防鼠、防高温、防光、防尘)是档案长期安全保存的核心…

Windows 权限维持之 Meterpreter 深度解析

目录 Windows 权限维持之 Meterpreter 深度解析 一、Meterpreter 权限维持概述 二、Meterpreter 权限维持技术详解 (一)Persistence 模块 - 注册表后门 (二)Meterpreter 服务后门(Meterpreter SVC) 三、其他…

《创业之路》-841-从产品生命周期的特点,看创新者的窘境,以及破局之道。

从产品生命周期(Product Life Cycle, PLC)的角度来理解“创新者的窘境”及其破局之道,可以更清晰地揭示技术演进、市场需求变化与企业战略之间的深层矛盾。一、产品生命周期的四个阶段产品生命周期通常分为四个阶段:阶段特点1. 引…

【数据集】各县公路里程数据集(2000-2023年)

数据简介:中国各县公路里程数据指全国范围内县级行政区(包括县、县级市、自治县等)在特定年份(2000-2023年)内实际达到《公路工程技术标准》规定的等级公路里程总和。中国各县公路里程数不仅反映了区域交通基础设施的发…

《创业之路》-842-任何事物、任何产品、任何技术、任何商业模式,都有生命周期,“”企业”如何穿越周期,实现永续发展和基业长青?

这是一个深刻而关键的问题:在万物皆有生命周期的现实下,企业如何穿越周期,实现永续发展与基业长青?克莱顿克里斯坦森在《创新者的窘境》中揭示了“成功反噬成功”的悖论;彼得德鲁克强调“企业的目的是创造顾客”&#…

《2026年中国GEO优化服务商综合能力评估报告》发布

《2026年中国GEO优化服务商综合能力评估报告》的深度研究报告正式发布。该报告首次基于官方公开数据,从十个维度对国内主流的GEO(生成式引擎优化)服务商进行了系统性的综合能力评估,旨在为快速发展的AI营销领域提供一个客观、可验…

域名投资议题——新老顶级域的选择

关于Dynadot Dynadot是通过ICANN认证的域名注册商,自2002年成立以来,服务于全球108个国家和地区的客户,为数以万计的客户提供简洁,优惠,安全的域名注册以及管理服务。 Dynadot平台操作教程索引(包括域名邮…

2026音乐版权下载最新排行榜:国内三大权威平台TOP推荐,最全资源合集轻松规避侵权风险必藏清单

随着短视频创作、商业广告、影视制作等领域的蓬勃发展,商用音乐版权合规已成为刚需。2026年《著作权法》实施深化背景下,未经授权使用音乐面临高额赔偿风险。本文筛选国内三大权威音乐版权下载平台,从核心素材资源、版权授权合规、价格体系性…

Realme会有一加的好命吗?

Realme回归,年轻人还够用吗?作者|景行编辑|古廿“Realme回来,一加怎么办?”这是Realme回归OPPO消息传出后,一条颇具代表性的社区评论。1月7日,据界面新闻报道,Realme将回归OPPO体系,…

2026商用音乐网站最新排名TOP6:最全资源合集,必看必藏!轻松规避侵权风险,彻底避免不踩坑

随着商用音乐需求的激增,版权侵权风险也随之攀升。据中国版权保护中心数据显示,2025年国内因音频素材侵权引发的纠纷案件超1.5万起,同比增长26%,其中商用场景侵权占比高达70%。为帮助创作者精准规避风险,本文结合核心素…

智能吸虫塔:精准识别益害昆虫,指导生物防治策略

智能吸虫塔能够精准识别益害昆虫并指导生物防治策略,其核心优势体现在高效捕获、精准识别、环境适应性强、自动化程度高及数据驱动决策等方面,具体分析如下:高效捕获与精准识别高效捕获:智能吸虫塔采用垂直风道设计,利…

轻松将 Android 数据备份到 Mac

备份至关重要,因为它可以防止数据丢失。然而,使用安卓手机和 MacBook 的用户可能会发现将安卓设备备份到 Mac 有点困难。幸运的是,这已经成为过去。即使安卓和 Mac 的兼容性并不好,阅读本指南后,你也能有效地将安卓数据…

靠CAXA 3D前移质控关口,从救火队长变规划师

干质量管控整整二十年,以前在厂里,我就是个实打实的“救火队长”。不管是设计环节埋下的隐患,还是生产过程出的纰漏,最后都得我来兜底解决。加班排查问题、协调返工整改,天天围着突发状况转,累得够呛还不讨…

5-500MW光伏组件生产线品质升级 曜华激光源头厂家全流程设备赋能

光伏产业进入高质量发展新阶段,组件品质是企业核心竞争力,5-500MW光伏组件生产线的品质把控能力直接决定产品市场表现。从电池片加工到成品检测,各环节设备性能均关键影响最终品质。选择源头设备厂家,可获得全流程高品质设备与定制…

认证授权版图——OAuth2.1与OIDC在企业中的落地路径与常见误解

写在前面,本人目前处于求职中,如有合适内推岗位,请加:lpshiyue 感谢。同时还望大家一键三连,赚点奶粉钱。现代身份认证体系不是单一协议的应用,而是多种标准在安全、体验与可管理性间的精密平衡在完成微服务…