为什么说RAG是AI 2.0时代的“杀手级”应用?

你好,我是常扬,欢迎你加入到《RAG 快速开发实战》课程的学习中。

在正式开始之前,我想先介绍一下自己,我本科在同济大学学习软件工程,后来又在复旦大学攻读人工智能方向的硕士和博士,期间发表过多篇 SCI 核心论文。目前在一家知名 AI 公司任职研发总监,已经有十余年了,负责从 AI 数据清洗、训练、测试系统等 AI 研发平台搭建,到 AI 技术产品、云服务平台以及大模型应用探索。

这些年我跟随时代的脚步,跨过了移动互联网,又从 AI 1.0 进入 AI 2.0 时代。可以说,我既是互联网软件开发者,也是 AI 学术研究者,这些年我在开发者的视角下,带入 AI 学术的洞见,以研发可用、好用的 AI 产品为追求目标,致力于把自己的经验和知识传播给更多的同行者。

同时,我经常参与会议演讲与技术社区活动,与开发者保持高频的面对面交流,深刻理解开发者在 AI 应用开发中面临的挑战,尤其是在技术选型和应用优化方面的需求。在 WAIC、VALSE、CCIG、InfoQ AICon、AiDD 等多个学术会议及开发者大会上,我分享 RAG 相关的专题内容,曾获得开发者们的青睐,荣获最佳演讲主题奖。

同时我作为 CSDN 和微信公众号的 AI 专家博主,这些年一直坚持写作,传播 AI 科研技术与 AI 工程应用的经验,希望将 AI 学术与工程实践紧密结合,来推动 AI 行业的发展。

为什么做 AI 产品工程研发要充分掌握 AI 技术?

我在企业中成功打造过 ToC 和 ToB 的 AI 产品,深知 AI 产品从 MVP(Minimum Viable Product, 最小可用产品)到 PMF(Product-Market Fit, 产品市场契合)的演进过程中所面临的挑战。做一个 AI 产品的 Demo 容易,但要把它打造成好用的产品却极为困难。

PMF,产品和市场的最佳契合点,是产品满足市场需求令客户满意的里程碑,也是产品成功和业务增长的起点。要实现 AI 产品的 PMF,首先需要充分了解 AI 技术,明确技术的边界,避免盲目乐观或悲观,找到合适 AI 技术的应用场景。其次,深刻理解业务是关键,用户需求决定产品方向,AI 技术则是为业务服务的工具。在验证阶段,优先使用最佳 AI 模型以确保产品满足市场需求,确认后再逐步降低模型成本。

在整个过程中,要始终坚持业务优先、价值至上的原则,避免团队走向纯 AI 科研化,脱离实际应用场景做 AI 技术选型。最关键的是,通过构建 AI 产品的独特壁垒,有效抵御增长过程中竞争者的模仿与复制。

而我做这样一门课程的原因就是希望通过分享 RAG 技术,结合我在企业 RAG 项目中的工程与产品经验,帮助你更深入地理解 RAG 和大模型技术的优势与局限。我将从学术角度揭示 RAG 的本质,厘清技术边界,从工程角度引导你如何根据具体场景和用户需求进行合理的技术选型,从产品角度帮助你构建自己的 RAG 产品壁垒,实现业务的可持续增长。

为什么选择 RAG 技术?

在由 OpenAI ChatGPT 引领的 AI 2.0 大模型时代,我们见证了大模型(LLM, Large Language Model)在知识、逻辑、推理能力上的突破,其通识理解能力已超越许多人类专家,并且仍在飞速进步,尚未达到顶峰。

Scaling Law、压缩产生智能、边际成本为零就是理想中的 AGI,AI 2.0 技术范式的变革正在引发 AI 软件时代的巨大变迁,正如移动互联网时代的到来使得 PC 时代的软件应用迅速成为历史一样,大模型将带来大量应用机会,AI“杀手级应用”将不断涌现,且数量会越来越多。作为软件工程师,我们正处于一个充满机遇的历史时刻,拥抱 AI 应用已成为必然选择。

尽管大模型功能强大,但它当前仍存在幻觉、知识时效性、领域知识不足及数据安全问题的局限性。RAG(Retrieval Augmented Generation,检索增强生成)技术正是在这样的背景下应运而生,成为了当前大模型应用的重要技术方向,文档问答类 LLM RAG 应用也被认为是 AI 2.0 时代最早落地的应用类型之一。

RAG 技术使开发者能够在无需为每个特定任务重新训练或微调大模型的情况下,通过连接外部知识库和文档,为模型注入额外的非参数化知识,从而显著提升其在专业领域的能力和回答精度。RAG 技术赋予大模型在各行各业和各种垂直场景中巨大的效率和体验价值,有望成为最快涌现的“杀手级应用”,已成为大模型应用落地最热门的方向之一。

对于 RAG 应用开发者来说,相较于移动互联网软件开发、AI 1.0 时代的 AI 能力集成,最大的变化是 AI 技术的深度使用,需要更加深入地理解 AI 技术组件,具备调整组件内部细节的能力,以便进行更好的 AI 软件编排和提升应用效果。比如文档分块、向量化嵌入、向量数据库、相似度查询、召回、重排序、大模型和提示词等众多 AI 相关概念,都需要深入了解,才能根据业务场景进行最合适的技术选型。甚至在某些情况下,开发者还需掌握这些技术的细节,亲自进行组件的改造和优化,才能实现最佳的应用效果。

这些新技术词汇和组件可能看起来令人望而生畏,但我保证,如果学习方法得当,这些 AI 技术组件其实是容易掌握和操作的。我从软件工程师成长为 AI 领域的研究者和从业者,深知在初涉 AI 应用开发时的迷茫感受。在这门课程中,我会凝聚自己在 AI 工程和学术能力成长过程中的经验与教训,帮你拨开迷雾,通过第一性原理深入理解每一个 AI 技术点的本质,从技术根基的扎实掌握,到应对客户场景时的灵活运用组件,让你快速掌握 RAG 技术能力,紧跟 AI 2.0 时代的巨大产品机遇。

这门课是怎么设计的?

就像学习编程语言从 “Hello World” 开始一样,我们也从实战出发,通过实践来获取知识。不同于传统教材从知识点逐步推向系统应用的方式,我们的课程从一个完整的 RAG 项目实战入手,先帮助你打造完整的 RAG 知识架构。

随后,我们将每个独立的技术点通过代码实战逐一填充到这个框架中,同时每一次学习都能加深对整体架构的理解。最终在课程结束之后,面对简单的业务场景,你将能够快速选择合适的技术组件,完成 LLM RAG 应用的编排和产品搭建;面对复杂的业务场景,你也能凭借掌握的核心技术原理,判断优化方向,集中精力提升产品性能,打造出极具竞争力的 RAG 产品。

课程开始,我会先用一节课介绍 RAG 技术的核心本质和技术流程,随后立即进入从 0 到 1 快速搭建 RAG 应用的实战。在实战过程中,我会对技术选型、组件库以及代码的每一行都进行必要的分析和注释,力求每行代码都能清晰表达 RAG 框架中的技术关键点,避免无关的代码让你失去焦点,从而使你专注于 RAG 知识的掌握。

接下来,课程将从业务场景出发,逐步介绍 RAG 的核心技术流程,包括索引、检索、生成中的各个技术组件,以及针对具体业务需求进行的组件优化实战。我们会持续迭代和优化 RAG 应用项目的代码,每节课都会提供可运行的代码文件,代码实战与知识点相互印证,最终实现对 RAG 技术组件相关知识的全面掌握和代码项目实践能力的双提升,达到不仅能使用技术,还能改进技术的层次。

课程结尾,我会介绍 RAG 的进阶内容,并紧跟前沿研究动态。RAG 进阶部分将结合复杂业务场景,选择更加复杂的技术流程和组件,快速找到优化方向,提高产品性能,构筑产品壁垒。我们正处在 AI 2.0 极速变化的时代,甚至每个月技术进展都会发生巨大的变化,掌握前沿研究动态将为我们的产品塑造先发竞争优势,使我们在先发优势的时间窗口内抢占市场和用户。

最后,我想说的是,AI 2.0 为我们带来了巨大的时代机遇,将创造前所未有的社会进步。我希望你能够积极拥抱 AI 技术,它并没有那么高深莫测,反而正在逐步走向产业化、普及化。就像当初的移动互联网技术,早期进入的那批企业和个人都享受到了时代带来的红利。

雷军在《小米的创业思考》有句话:当遭遇复杂问题时,对工程师而言,最重要的是先找到“第一把扳手”,立即行动起来。那么,让我们从现在开始吧!

免费资料

另外,我还给大家准备了一套特别全的「AI 大模型学习资料包」,首次免费送给大家(买不买课都送)!
✅ AI 大模型学习路线图(2025 版)
✅ GeekAGI 知识库:DeepSeek、AI Agent 、MCP、AI 工具和框架、AI 提效案例
✅ AI 大模型面试题 300 道
✅ 26 套 AI 大模型行业研究报告
✅ 50+ AI 大模型必读电子书

👇👇扫码免费领取全部内容👇👇

资料详细内容如下
福利 1:AI 学习路线图(2025版)
2025 年入门 AI 大模型该学什么,有这张图就够了!

福利 2:GeekGI 知识库
DeepSeek 知识库
AI Agent 知识库
1200+ AI 工具和框架
MJ、SD 等 AI 应用的一条龙教程
AI 经典开源项目、工作提效 / 副业变现案例

福利 3:AI 大模型面试题 300 道
包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG、Agent 面试真题…
福利 4:24 套技术大会 2025 年案例 PPT

👇👇扫码免费领取全部内容👇👇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1155492.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

零基础也能学懂提示词?OpenCSG公益课给出清晰学习路径:从“会问”到“会驱动”

提示词工程的进阶路径不是背技巧,而是从简单到复杂的“表达升级”。本文给出零基础可执行的学习路线与写法框架,让你用自然语言更精确地驱动AI完成复杂任务。 一、先建立一个判断:你写的不是“问题”,而是“任务指令” 很多提示…

通义深度搜索-生成对话

产品链接 面向深度的查询问答和调研分析需求场景,多步骤推理规划研究路径,生成有洞察、可溯源、图文并茂的长文报告-大模型服务平台百炼(Model Studio)-阿里云帮助中心 本产品(通义深度搜索)对外服务接口目录。所有接口使用 DashScope HTTP 协议对外提…

机器学习:基于python二手房数据分析系统 可视化 Scrapy 爬虫 链家二手房数据 Django框架 基于用户的协同过滤推荐 二手房推荐系统 (源码)

博主介绍:✌全网粉丝10W,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,…

机器学习:python招聘数据分析可视化系统 机器学习 招聘推荐 薪资预测 爬虫 决策树回归模型 XGBoost回归模型 Flask框架 前程无忧

博主介绍:✌全网粉丝10W,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战6年之久,选择我们就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与…

书籍-塔西佗《编年史》

塔西佗《编年史》详细介绍 书籍基本信息 书名:编年史(Annales / Ab Excessu Divi Augusti) 作者:塔西佗(Publius Cornelius Tacitus,约56-120年) 成书时间:约公元110-120年 卷数&…

如何翻译图片?图片上的外语一键翻译成中文,教程来了~

工程图纸是扫描图可以翻译吗?手机拍的图纸照片可以翻译吗?图片形式的图纸可以翻译吗?针对以上三类工程图纸翻译常见问题,进行统一答复:PlanForm-AI工程图纸翻译都可以翻译,教程如下:1.如果你遇到…

物联网毕设 基于单片机的红外热视仪(源码+硬件+论文)

文章目录 0 前言1 主要功能2 硬件设计3 核心软件设计4 实现效果5 最后 0 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己…

机器学习:python租房数据分析可视化系统 K-means聚类算法 线性回归预测算法 机器学习 链家租房网 Django框架 scrapy 爬虫(建议收藏)

博主介绍:✌全网粉丝10W,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,…

OpenCSG课程精华:为什么结构化提示词更有效?Markdown / XML / JSON 的正确打开方式

构化提示词的关键不是“好看”,而是边界清晰、可被系统消费。本文解释 Markdown、XML、JSON 三种结构化方式的适用场景,并给出更稳的输出控制方法。 一、结构化的意义:先解决“边界不清”,再谈“表达优雅” 大模型最怕的是混淆&…

jmeter基础知识-安装配置环境变量

1.安装JDK 2.配置java环境变量 搜索栏输入编辑环境变量 用户变量:只对当前用户生效 系统变量:对所有用户生效 点击新建在变量名中输入:JAVA_HOME 变量值中输入jdk的安装路径 例如:C:\ProgramFiles\Java\jdk1.8.0_161 再次点击…

RH134 第八章 管理存储堆栈

一 创建和拓展逻辑卷1.1 逻辑卷(LVM)概念LVM 有助于更加轻松地管理磁盘空间。可以将卷组 Volume Group 中的可用空间分配给逻辑卷 (Logical Volume),并且可以调整文件系统的大小✔ 如果磁盘出现错误,可将替换磁盘注册为物理卷 (Ph…

什么是PKI

文章目录 为什么需要PKIPKI应用场景有哪些PKI是如何工作的 公钥基础设施PKI(Public Key Infrastructure),是一种遵循既定标准的证书管理平台,它利用公钥技术能够为所有网络应用提供安全服务。PKI技术是信息安全技术的核心&#xf…

在Spring Boot项目中,Shiro和Spring Security该如何选择?

安全管理是Java应用开发中无法避免的问题,随着Spring Boot和微服务的流行,Spring Security受到越来越多Java开发者的重视,究其原因,还是沾了微服务的光。作为Spring家族中的一员,其在和Spring家族中的其他产品如SpringBoot、Spring Cloud等进…

2026软件测试金3银4常见的软件测试面试题

现阶段很多测试同行抱怨工作难找,网上的面试题又真不真实先不说,乱七八糟的,下面是我耗费了三个月时间的、结合真实的实际面试情况所写下的真实软件测试面试题以及,如何回答,总共十个章节以及写成一个文档全文8w多个字…

从GPT到智能体:OpenCSG带你看清提示词工程的“执行力升级”——拆分步骤、工具调用与安全边界

复杂任务失败的根源,常常不是模型不行,而是“一步到位”不成立。本文给出可落地的拆分方法、多轮调用策略,并补齐智能体场景下必须重视的安全边界。 一、复杂任务的第一原则:不要指望“一次调用做完一切” 当任务包含“理解→规…

计算机毕业设计springboot二手房租售管理系统设计与实现 基于Spring Boot框架的二手房交易与租赁管理系统开发与应用 Spring Boot驱动的二手房买卖及租赁信息管理平台设计与实现

计算机毕业设计springboot二手房租售管理系统设计与实现z86u2 (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着房地产市场的不断发展,二手房交易和租赁的需求日益…

计算机毕业设计springboot校园服务平台 基于SpringBoot的校园综合服务平台设计与实现 SpringBoot框架下的校园服务管理系统开发

计算机毕业设计springboot校园服务平台alsns9 (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着信息技术的飞速发展,校园管理和服务的数字化转型已成为必然趋势。传…

强烈安利9个AI论文网站,本科生毕业论文轻松搞定!

强烈安利9个AI论文网站,本科生毕业论文轻松搞定! 2.「云笔AI」—— 解决 “杂事”,节省时间(推荐指数:★★★★☆) “云笔AI”是一款专为学术写作设计的智能工具,它的核心优势在于能够帮助用户高…

只需根据接口文档,就能轻松开发 get 和 post 请求的脚本

前言 一般的接口文档描述的内容: ​开发get请求的脚本,接口文档的描述如下: 在loadrunner里面创建一个空脚本: ​在action空白处,点击insert—>step 输入web_custom_request,双击选择该函数&#xff0c…

学Java后端必须学spring,spring框架为什么这么多人用?

Spring是我们Java程序员面试和工作都绕不开的重难点。很多粉丝就经常跟我反馈说由Spring衍生出来的一系列框架太多了,根本不知道从何下手;大家学习过程中大都不成体系,但面试的时候都上升到源码级别了,你不光要清楚了解Spring源码…