RAG技术演进:从检索辅助到智能体,掌握大模型应用的关键技术!

简介

RAG技术从早期的"检索+阅读"流水线发展到当前的系统化、可信化与智能体化。其演进可分为三个阶段:2017-2019年初步探索、2020-2024年与LLM融合、2025年走向系统化。当前面临的主要挑战包括检索可靠性、系统效率和生成可信度。未来发展趋势包括GraphRAG、SafeRAG和Agentic RAG等,RAG正从提升准确率的工具演变为构建高可靠语言智能体的核心框架。


一句话总结:该综述系统梳理了 RAG 技术的发展脉络,从早期开放域问答任务中的原型,到近年来多领域大规模应用的系统化演化,进行了全面而深入的总结。

前文速览:RAG 是当前提升大语言模型回答质量与准确性的最常用技术形态之一,也很可能已经成为全球范围内最普遍的大模型应用架构我们已系统介绍了:RAG 是什么、为什么需要 RAG、RAG 如何工作,以及如何评估一个 RAG 系统等核心问题。

图片由 Nano Banana Pro 生成

在这篇 2025 年最新的 RAG 综述中,研究者系统梳理了过去一年的技术进展,提出了新的分析视角,并探讨了未来的发展趋势。本系列文章也将对其进行解读和日常案例挖掘。

在本期内容里,我们主要聚焦在这些问题里:

RAG 的技术发展历程是什么?

RAG 当前面临哪些挑战?又有哪些解决方案与未来优化方向?

下面让我们一起来读读这篇文章吧~

一、RAG 技术发展历程:从“检索辅助”到“可信智能体”

RAG 到底是不是“新技术”?

答案是否定的。

RAG 并非横空出世,而是自然语言处理领域围绕**“如何让模型可靠地使用外部知识”这一核心问题,持续十余年的系统性演进结果**。

从早期的“检索 + 阅读”流水线,到与大模型深度融合,再到当前的图知识、安全与智能体化方向,RAG 已逐步从一种性能优化手段,演变为构建高可靠、可更新语言系统的基础框架。

整体来看,其发展大致可分为三个阶段。

  1. 2017–2019:早期方案与初步探索
  2. 2020–2024:RAG 的诞生与与 LLM 的融合
  3. 2025:走向系统化、可信化与智能体化

2017–2019:早期方案与初步探索

在没有 RAG 之前,研究者是如何做问答的?

在“RAG”这一术语正式提出之前,研究者已经开始尝试将信息检索与神经模型结合,用于开放域问答(Open-domain QA)和知识密集型任务。

这一时期的主流范式是典型的“检索—阅读”流水线

  • 先由搜索或检索模块,从大规模语料中定位相关文档;
  • 再由神经阅读器(如 BiDAF、BERT-based Reader)在文档中抽取答案

这类系统在当时显著优于纯基于规则或传统 IR 的方法,但仍存在明显局限:

  1. 以抽取式问答为主,难以生成自然、完整的回答;
  2. 检索与阅读器相互独立,无法端到端联合优化
  3. 对复杂推理、多文档证据整合支持有限。

可以说,这一阶段的研究为 RAG 提供了重要的思想与技术基础,但尚未形成真正意义上的“生成式检索增强模型”。

2020–2024:RAG 的诞生与与 LLM 的融合

2020 年,RAG 正式诞生。

研究者首次明确提出: 将知识显式拆分为检索器(Retriever)生成器(Generator),并在生成过程中动态调用外部文档。

经典 RAG 架构采用:

  • 稠密文段检索器(如 DPR)负责语义检索;
  • 序列到序列生成模型(如 BART),负责基于多文档进行生成。

这种方式将参数化记忆(模型参数)非参数化记忆(外部知识库)结合,使模型在知识密集型问答任务上显著超越了传统流水线系统。到 2020 年底,检索增强已成为开放域问答任务中的核心技术路径之一。

2021 年,研究重心转向“检索与生成如何更好协同”。

这一年,RAG 的研究不再局限于问答性能本身,而是开始系统性探索:

  • 检索结果如何影响生成过程;
  • 生成器如何整合多文档证据;
  • 检索噪声与证据冲突如何处理。

与此同时,RAG 的应用场景迅速扩展至:事实核查、知识锚定对话、实体密集型与知识推理任务

统一基准(如 KILT)与开源代码的出现,使 RAG 从“研究原型”逐步走向可复现、可比较的技术体系

2022 年,RAG 走向规模化与专业化。

RAG 不再只是问答模型,而逐渐被视为“知识密集型 NLP 的通用解决方案”。 这一阶段研究者们发现:

高质量检索 + 多文档推理,是构建事实性语言模型的关键路径。

2023 年,RAG 成为高可信度 LLM 应用的技术基石。

随着 ChatGPT、企业级对话系统和插件生态的兴起,“先检索、后生成”的范式被广泛用于:

  • 缓解大模型幻觉问题;
  • 实现训练后知识更新;
  • 提供可追溯的外部依据。

RAG 至此不再只是学术概念,而成为高可信度大模型应用的“标配能力”。

2024 年,研究进一步聚焦“可靠性与专业化”。

这一阶段的研究呈现出三大显著趋势:

  1. 安全与鲁棒性:系统性分析生成器忽略检索证据、冲突证据整合失败等问题,并提出针对性缓解机制;
  2. 多跳推理与长上下文融合:探索将检索索引与长上下文注意力机制协同使用。
  3. 领域 RAG:医疗、金融、法律等高风险领域的 RAG 系统引入事实核查与来源审核模块,确保只有可信证据才能影响最终输出。

2025:走向系统化、可信化与智能体化

进入 2025 年,RAG 的研究关注点发生了明显转移,主要体现在以下方向:

  • GraphRAG:通过引入知识图谱,提升复杂关系推理能力;
  • SafeRAG:系统性刻画 RAG 的攻击面与安全风险;
  • Agentic RAG:赋予模型“是否检索、如何检索”的自主决策能力;
  • 系统级评测(如 mtRAG):评估多轮对话与事实一致性,而非单轮准确率。

RAG 正在从“提升准确率的工具”,演进为“构建高可靠、可审计语言智能体的核心框架”。


二、当下挑战与解决方案、未来优化方向

在理解了 RAG 的技术演进后,一个自然的问题随之出现:

如果 RAG 已如此成熟,为什么在真实工程落地中仍然困难重重?

原综述将挑战拆分为八个技术点。这里我们将其进一步抽象为三个核心层面:

  • 检索是否足够可靠?
  • 系统是否足够高效?
  • 生成是否足够可信?

下面我们分别进行介绍。

检索:从相关性优化到“检索决策本身”

RAG 系统能否稳定工作,首先取决于检索阶段能否持续提供高相关、可用的知识块

**在检索质量层面,领域自适应训练已成为高价值场景的基础配置。**通过领域语料上微调嵌入模型,检索器能够更准确地理解专业术语与隐含语义,显著降低“语义相似但任务无关”的误检风险。与此同时,更强的语义编码器与查询改写技术被广泛用于缓解词汇不匹配与查询歧义问题。

在此基础上,重排序模型逐渐成为工业级 RAG 的标配组件:先通过快速向量检索获得候选文档,再利用深度语义模型进行精细打分,以可控的计算开销换取更稳定的证据排序质量。

进一步的发展方向,则是迭代检索与思维链驱动的查询拆解——将复杂问题分解为一系列语义明确的子问题,逐步完成知识定位。

值得注意的是,**最新研究已经不再将“检索”视为一个被动模块,而是开始关注检索决策本身:即模型是否需要检索、需要检索多少、以及何时停止检索。**这一思路直接催生了结合强化学习与规划能力的 Agentic RAG,使检索从“固定步骤”演进为“可学习策略”。

系统:从算法优化到工程架构演进

在性能层面,高效近邻搜索结构(如 HNSW)与多级缓存机制被广泛用于降低检索延迟;包括 RAGCache、嵌入相似度缓存等策略,在真实业务中显著减少了重复计算。同时,自适应检索策略也被用于根据查询复杂度动态调整检索深度。

更重要的是,实践逐渐验证了一个关键结论:RAG 并未消除计算复杂度,而是将复杂度从模型参数转移到了系统基础设施

Atlas、RETRO 等研究表明,“中等规模模型 + 大规模外部语料”的组合,在性能上可以超越无检索的超大型模型。这使 RAG 成为降低模型规模依赖、优化算力成本的重要路径,但前提是具备稳定的索引、缓存与数据流水线。

随着语料规模持续扩张,可扩展性与知识新鲜度成为长期关注重点。通过增量索引更新、选择性文档重编码与实时搜索接口,RAG 系统能够在不重训练模型的前提下持续演进。

这一趋势,正在推动 RAG 从静态系统走向长期运行的知识基础设施。

生成:从“减少幻觉”到“机制性约束”

降低幻觉是 RAG 的重要动机之一,但共识已经十分明确:幻觉无法被彻底消除,只能被系统性约束。

围绕这一目标,最有效的策略并不是单纯提升生成能力,而是强化证据锚定机制。通过将生成内容与检索文档显式绑定,并在训练阶段惩罚无证据表述,可以显著降低事实错误的发生概率。Self-RAG 等方法则进一步引入生成后的自我校验机制。

**在高风险场景中,外部验证模块(如事实核查与可信度评估)逐渐成为 RAG 流水线的重要组成部分。**尤其值得强调的是,来源引用的透明化不仅提升了用户信任,也从机制上压缩了无证据生成的空间。

随着 RAG 被广泛用于金融、医疗与政务等关键领域,其挑战已不再局限于技术性能,而是扩展至社会与伦理层面。

当前的实践路径包括:多样化数据源构建、检索结果多样化、嵌入模型偏见调优,以及“源头管控 + 事后验证”的双重防线。SafeRAG 的提出,标志着 RAG 已开始以系统视角应对安全与攻击问题。

三、小结

RAG 的核心优化目标,正在从“提升单次回答质量”,转向“构建可控、可扩展、可审计的语言系统”。

它所代表的,已不只是某一种模型架构或工程技巧,而是一套关于如何让大模型在真实世界中被安全、可靠地使用的系统方法论。

从个人学习与科研辅助,到企业级知识管理与智能系统,RAG 正在逐渐成为越来越多真实场景中的**“默认架构选择”**。

那么也想问问小伙伴们:

在你的学习、科研或工作中,你是如何使用 RAG 的?

是用它来构建个人知识库、辅助论文阅读与调研, 还是将它接入业务文档、客服系统,甚至作为核心生产力工具?

四、如何学习AI大模型?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高

那么针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份LLM大模型资料分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以扫描下方二维码领取🆓↓↓↓

学习路线

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1027606.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MeshLab文件格式全攻略:从新手到高手的3D模型处理指南 [特殊字符]

你是否曾经遇到过这样的情况:下载了一个精美的3D模型,却在MeshLab中无法正常打开?或者辛苦处理完模型后,导出时发现重要信息丢失了?别担心,今天我们就来彻底解决这些问题! 【免费下载链接】mesh…

项目风险管理:LobeChat识别潜在威胁

项目风险管理:LobeChat识别潜在威胁 在AI技术加速落地的今天,企业部署大语言模型(LLM)应用的热情高涨。然而,理想与现实之间往往存在巨大落差——许多团队在初期兴奋地接入GPT API后不久便发现:界面体验割裂…

LobeChat能否支持批量导入提示词?工作效率提升技巧

LobeChat能否支持批量导入提示词?工作效率提升技巧 在AI助手逐渐渗透到日常办公的今天,你是否也遇到过这样的场景:每次写技术文档都要重新输入一遍“请用清晰结构化语言输出,优先使用代码块和列表”;团队新人上手时总记…

FGO终极自动战斗工具:2025年新手快速上手指南

FGO终极自动战斗工具:2025年新手快速上手指南 【免费下载链接】FGA FGA - Fate/Grand Automata,一个为F/GO游戏设计的自动战斗应用程序,使用图像识别和自动化点击来辅助游戏,适合对游戏辅助开发和自动化脚本感兴趣的程序员。 项…

数组(练习)

练1.#include <stdio.h> int main() {//逗号表达式//int arr[] { 1,2,(3,4),5 };//1 2 4 5printf("%d\n", sizeof(arr));return 0; }练2.int main() {int num 10;//int arr[10] {0};printf("%d\n", sizeof(arr));//printf("%d\n", size…

LobeChat微信公众号文章开头生成技巧

LobeChat&#xff1a;构建智能内容创作流的核心引擎 在技术博主们熬夜写稿、反复修改公众号开头的今天&#xff0c;一个现实问题摆在面前&#xff1a;我们明明拥有强大的大模型能力&#xff0c;为什么每次发文前还要为“第一句话怎么写”绞尽脑汁&#xff1f; 这正是当前AI落…

【ACM出版,稳定检索设计类】2026年人工智能与产品设计国际学术会议 (AIPD 2026)

“2026年第二届人工智能与产品设计国际学术会议&#xff08;AIPD 2026&#xff09;”是一个致力于探索和展示人工智能如何彻底改变产品设计的各个环节&#xff0c;促进创新与效率的提升的重要学术会议。会议旨在汇聚全球产品设计界、信息技术专家、学者和开发者&#xff0c;讨论…

#GXUST AI通识课#AI写作工具#文多多PPT#笔格AI#两者对比

文多多PPT原提示词的大纲https://share.weiyun.com/VLPXSKNX 文多多PPT原提示词的PPThttps://share.weiyun.com/RmVQjAEF 文多多PPT优化后的提示词大纲https://share.weiyun.com/o4YBUA87文多多PPT优化后的提示词PPThttps://share.weiyun.com/tn4oIWtv 笔格AI原提示词的PPTh…

UnrealPakViewer终极指南:Pak文件分析与虚幻引擎资源管理完整教程

UnrealPakViewer终极指南&#xff1a;Pak文件分析与虚幻引擎资源管理完整教程 【免费下载链接】UnrealPakViewer 查看 UE4 Pak 文件的图形化工具&#xff0c;支持 UE4 pak/ucas 文件 项目地址: https://gitcode.com/gh_mirrors/un/UnrealPakViewer 你是否曾经为无法查看…

BetterNCM插件管理器深度体验:让网易云音乐秒变全能播放器

BetterNCM插件管理器深度体验&#xff1a;让网易云音乐秒变全能播放器 【免费下载链接】BetterNCM-Installer 一键安装 Better 系软件 项目地址: https://gitcode.com/gh_mirrors/be/BetterNCM-Installer 还在为网易云音乐功能单一而烦恼吗&#xff1f;BetterNCM这款神奇…

LobeChat科研基金申请书撰写助手

LobeChat&#xff1a;构建科研基金申请的智能中枢 在当今科研竞争日益激烈的环境下&#xff0c;一份高质量的基金申请书往往决定了一个课题能否获得资助。然而&#xff0c;从选题构思、文献调研到语言润色与格式规范&#xff0c;整个写作过程耗时耗力&#xff0c;且高度依赖研究…

2026年程序员转型秘籍:掌握这三点,大模型算法工程师年薪翻倍不是梦!

一位原本年薪60万的推荐算法工程师&#xff0c;系统性掌握大模型技能并完成一次成功的面试后&#xff0c;收到了三份Offer&#xff0c;最高的一份年薪达到了140万——这不是特例&#xff0c;而是2025年AI人才市场的日常。 根据行业最新数据&#xff0c;大模型算法岗位需求增幅达…

12 MyBatis的连接池

12 MyBatis的连接池连接池是什么存储连接的容器解决了什么问题如果没有连接池&#xff0c;那么每次都执行SQL语句都会创建connection连接&#xff0c;会浪费时间。影响程序的性能。MyBatis连接池的分类MyBatis内置了连接池技术&#xff0c;dataSource标签的type属性有3个取值PO…

手握明星开源项目却不会赚钱?GOBI 2025 全球开源商业创新大会全日程发布,附参会指南!

AI 时代&#xff0c;开源如何不再“为爱发电”&#xff1f;商业如何借助“源力”飞跃&#xff1f;当开源的理想主义之光&#xff0c;照进商业化的现实土壤&#xff0c;一个长久以来的问题摆在了所有技术人的面前&#xff1a;我们该如何平衡开放协作的精神与价值变现的渴望&…

Applite:告别命令行,轻松管理macOS应用的图形化神器

还在为复杂的Homebrew命令头疼吗&#xff1f;Applite作为一款现代化的macOS应用程序&#xff0c;专门为Homebrew Cask打造了直观易用的图形界面。这款开源工具将繁琐的命令行操作转化为简单的点击交互&#xff0c;让软件包管理变得前所未有的轻松。 【免费下载链接】Applite Us…

专业电竞的秘密:他们的路由器是怎么布置的呢?

对于职业电竞选手和顶级游戏主播而言&#xff0c;网络的好坏&#xff0c;是能决定胜负或直播流畅度的。而对于这类人群的路由器&#xff0c;它与普通家用路由器之间的差别&#xff0c;就如同专业赛车与家用轿车一样。从泛用连通到决胜优化的差距。够用和精准决胜普通家用路由器…

zfk_蓝桥杯C++学习_语言基础_线性表及顺序表

一、线性表 1.定义: 由n(n≥0)个数据特性相同的元素构成的有限序列,称为线性表。 2.线性表的特点: 线性表是n个数据元素的有限序列,其中n个数据是相同数据类型的。 线性表中元素的个数n(n≥0)定义为线性表的长度,当n…

当InfluxDB还在“散步”,金仓数据库已经“起飞”了!——一次不太公平的时序对决实录

金仓数据库&#xff08;KingbaseES&#xff09;是中国成立最早、拥有完全自主知识产权的国产大型通用数据库管理系统。其核心产品KingbaseES因其高可靠、高性能、高安全、易管理、易使用的特性而广受认可&#xff0c;是企业级关键业务应用的坚实数据底座。 金仓数据库由北京人大…

动态IP的使用方法

动态IP&#xff08;Dynamic IP&#xff09;是指由互联网服务提供商&#xff08;ISP&#xff09;动态分配的IP地址&#xff0c;每次连接网络时可能会变化。以下是使用动态IP的常见方法和注意事项。配置动态IP获取大多数情况下&#xff0c;设备默认设置为自动获取IP地址&#xff…

TradingView图表库K线生成机制深度解析与实战指南

TradingView图表库作为金融科技领域领先的可视化解决方案&#xff0c;其核心的数据流处理机制对于构建高性能交易系统至关重要。本文将从实际开发场景出发&#xff0c;深入剖析实时K线生成的核心原理&#xff0c;并提供可落地的技术实现方案。 【免费下载链接】charting-librar…