大模型相关概念 - 扩展知识理解

检索增强生成(RAG - Retrieval-Augmented Generation)

用户输入问题,AI 结合知识库内容和相关知识,生成准确、真实、具有时效性的回答结果。

生成流程

  • 检索阶段:根据用户输入内容,AI 在知识库中检索相关片段。
  • 增强阶段:拼接检索得到的相关文本和用户输入,形成增强后的上下文。
  • 生成阶段:基于增强后的上下文,生成最终的 AI 回答结果。

优点

  • 提升生成结果的准确度。
  • 实现动态实时资料更新。
  • 可根据领域替换相关专业知识。
  • 可追溯答案来源。

存在问题

  • 依赖检索资料的质量,资料质量差可能会有反效果。
  • 引入额外的计算和 IO 开销,生成速度更慢。
  • 需要定期维护检索的数据,使之保持最新。
  • 上下文受 AI 限制,对于过大的知识库存在瓶颈。

微调(Fine-Tuning)

使模型在某些领域专业化,适合用于专业领域研究。
使小模型在专业领域也能发挥作用,减少硬件开销成本。

微调 vs RAG

对比项微调(Fine-Tuning)RAG
知识来源内化到模型参数中外部知识库实时检索
更新成本需要重新训练只需更新知识库
适用场景固定领域、风格调整需要时效性、可追溯的场景
资源消耗训练时高,推理时低训练时低,推理时有检索开销

适用场景

  • 提示词:适合最基础的场景。
  • 微调:使模型适用对应领域。
  • RAG:引入知识库,提高专业领域的准确性。
  • RAG + 微调:使模型适应性和专业领域能力都得到提高, RAG 提供事实数据 ,再通过微调的模型负责理解、推理与表达。

工具调用(Tool Calling / Function Calling)

给 AI 配备工具箱,让 AI 自动调用工具完成工作。

让模型具备调用外部 API 的能力,扩展 AI 的实际操作范围。

常见能力

  • 支持读写文件
  • 搜索代码
  • 运行命令
  • 访问文档
  • 检查错误

工作流程

  1. AI 模型接收用户请求,并识别到需要额外能力。
  2. 模型按 JSON 格式生成一段特殊响应,指定要使用的工具及其参数。
  3. 应用程序运行该工具并返回结果。
  4. AI 模型将结果纳入上下文并继续对话。

工具调用内容

AI 调用时,会把数据转成 JSON 格式发送。

被调用的工具包含的核心参数内容:

  • name:调用的工具名称。
  • description:告知模型工具的用途和使用方式。
  • parameters:告知 AI 运行工具所需的参数和用途。

工具定义示例

{"name":"read_file","description":"从代码库中读取文件内容","parameters":{"filepath":"要读取的文件路径"}}

AI 调用示例

{"tool":"read_file","parameters":{"filepath":"src/components/Button.tsx"}}

Token 消耗

使用工具会更快占满上下文窗口,调用工具会在两个地方消耗 token:

  1. 工具定义包含在输入上下文中(通常每个工具会占用几百个 token)。
  2. 工具结果添加到输出上下文中(具体取决于工具返回的内容)。

模型上下文协议(MCP - Model Context Protocol)

类似于 USB 协议,实现 AI 工具和应用之间的即插即用。

MCP 是一种标准化协议,只需编写一套工具,就可以在多个 AI 应用中运行。

使 AI 更方便集成到各类应用中并使用各种工具。

核心价值

  • 标准化:统一的工具调用接口。
  • 可复用:一次开发,多处使用。
  • 互操作:不同 AI 应用间的工具共享。

智能体(AI Agent)

类似于自动驾驶,AI 自主规划路线并执行任务。

手把手教你从0到1搭建一个AI Agent(智能体)

本质是多个工具在循环运行,将开发者从任务执行者转变为任务管理者

将最终要实现的内容告诉 AI,让 AI 完成整个流程,而非一次次的问答。AI 根据自身推理逐步调用工具完成任务。

核心特点

  • 自主推理:具有自主规划和决策能力。
  • 工具集成:可调用多种工具执行实际操作。
  • 循环执行:观察 → 思考 → 行动 → 反馈的闭环。

存在问题

  • 只能类比为初级开发者,在开发过程中需要进行测试和约束。
  • 可能会存在循环试错的问题,需要人工介入。

使用建议

  • 从小任务逐步向大任务过渡。
  • 将其作为执行者,开发者作为审查人和架构师存在。

相关产品

  • AI 编辑器:Cursor、Cline、Trae 等。
  • AI 视频创作:自动化视频生成工具。

参考资料

  • Tool Calling | Cursor Learn
  • Retrieval Augmented Generation (RAG) and Semantic Search for GPTs
  • 微調與 RAG:哪種方法可以最大限度地提高 LLM 的績效?
  • RAG vs fine-tuning vs. prompt engineering | IBM

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1194375.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot 3整合MyBatis-Plus踩坑实录(90%新手都会忽略的3大配置细节)

第一章:Spring Boot 3整合MyBatis-Plus踩坑实录(90%新手都会忽略的3大配置细节)在升级至 Spring Boot 3 后,整合 MyBatis-Plus 时许多开发者遭遇了启动失败、依赖冲突或自动配置失效等问题。这些问题大多源于 Java 17 的强封装机制…

RAG避坑指南!面试官最爱问的几个问题

RAG落地的三大认知误区很多人以为RAG就是简单的"检索生成",结果一做就是坑。误区一:技术至上,忽视业务场景去年某银行做客服RAG,技术团队选了最先进的向量模型,结果上线后发现:用户问"信用卡…

聊聊北京执行案件律师事务所,壹翔律所服务靠谱吗?

一、基础认知篇 问题1:手握胜诉判决书却拿不到钱,该找什么样的律师事务所? 很多当事人打赢官司后以为万事大吉,却陷入法律白条的困境——被执行人隐匿财产、账户空空,执行法官精力有限难以深挖线索。这时需要的不…

封头供应商怎么选择,新乡市光大机械给出答案

在工业生产的精密链条中,封头作为压力容器、储罐等核心设备的安全屏障,其品质直接关乎生产安全与企业效益。面对市场上良莠不齐的封头供应商,如何避开材质不达标、成形缺陷、精度偏差等痛点,找到真正靠谱的封头厂家…

实力与口碑并重:倒置荧光显微镜厂家的深度选择指南

行业新格局:国产力量的崛起在现代生命科学实验室里,倒置荧光显微镜早已超越了"观察工具"的范畴,成为推动科学发现的核心引擎。近年来,中国在高端科研仪器领域的发展轨迹令人瞩目。根据国家统计局和科技部…

高速分散机厂家现货清单 2026:可定制 + 价格亲民,中小企业首选

2026高速分散机选购指南:5大厂家解析与中小企业选型策略面对市场上眼花缭乱的高速分散机品牌,一家涂料生产企业的技术主管发现,选择合适的设备不仅关乎产品质量,更直接影响生产成本与生产效率。2025年,全球高速分…

2026年烟台汽车改装公司推荐:聊聊阳光车品膜改大师性价比怎么样

本榜单依托全维度市场调研与真实车主口碑,深度筛选出五家烟台本地汽车贴膜与改装标杆企业,为车主选型提供客观依据,助力精准匹配适配的服务伙伴。 TOP1 推荐:烟台阳光车品膜改大师 推荐指数:★★★★★ | 口碑评分…

从本地化合规到多云部署:CI/CD工具的差异化竞争格局解析

从本地化合规到多云部署:CI/CD工具的差异化竞争格局解析 在数字化转型浪潮下,DevOps实践已成为企业提升软件开发效率的必备能力。作为DevOps核心组件的持续集成与持续交付(CI/CD)工具,正在经历从单一功能向多元化发展的…

2026年推荐翻译公司,天使(上海)外语翻译有限公司靠谱且覆盖行业广!

本榜单依托全维度市场调研与真实行业口碑,深度筛选出五家标杆翻译企业,为有语言服务需求的个人与企业选型提供客观依据,助力精准匹配适配的服务伙伴。 TOP1 推荐:天使(上海)外语翻译有限公司 推荐指数:★★★★…

browcli.dll文件丢失找不到 免费下载方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

win10电脑输入法字体修改

前提:按左下角fn,发亮 Ctrl + Shift +F

每日面试题分享149:JVM由哪些部分组成?

JVM由四部分组成:类加载器子系统、运行时数据区、执行引擎、本地方法接口。类加载器子系统就是把编译后的class文件从内存或磁盘加载出来。运行时数据区就是存储数据、变量。执行引擎相当于一个翻译官,将代码翻译成机器能懂的指令去执行。本地方法接口可…

为什么你的项目还在手动写CRUD?Spring Boot 3 + MyBatis-Plus一键生成揭秘

第一章:为什么你的项目还在手动写CRUD?Spring Boot 3 MyBatis-Plus一键生成揭秘在现代Java开发中,重复编写增删改查(CRUD)代码不仅耗时,还容易引入低级错误。Spring Boot 3 联合 MyBatis-Plus 提供了强大的…

我们是怎么把AD域控弱密码排查,从临时任务变成日常机制的

在很长一段时间里,我们对弱密码的管理方式,和大多数企业一样:检查一次,安心一阵。直到一次内部安全复盘,我们发现一个残酷事实:我们根本不知道,现在还有没有弱密码。一、弱密码最大的风险&#…

browseui.dll文件丢失找不到 免费下载方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

社会工程学视角下的市场信号矫正工程:重构非正式市场的真实价值逻辑

社会工程学视角下的市场信号矫正工程:重构非正式市场的真实价值逻辑社会工程学视角下的市场信号矫正工程,是针对婚恋、生存等非正式市场的核心治理手段。其本质是通过系统性规则重构、设施改造与主体赋能,消除制度性扭曲带来的信号失真 —— …

合规审计,真正折磨 IT 的从来不是检查,而是准备

大多数企业的合规状态,其实只有两种:一种是“没来查”,一种是“正在准备”。而很少有企业能说:我们现在就是合规状态。一、审计真正消耗的,不是能力,是时间账号数据在 AD;风险情况在表格&#x…

2026年收银系统源码供应商哪家好?五大优质推荐,点餐收银/超市收银/开源收银更方便

在零售与餐饮行业加速数字化转型的背景下,越来越多企业开始关注“收银系统源码”这一关键词。不同于按月付费的SaaS模式,拥有完整源代码、支持私有化部署的点餐收银系统、超市收银系统或奶茶店收银系统,正成为中大型…

每日面试题分享150:Redis通常用于什么场景?

1、做缓存提升系统性能2、做分布式锁解决并发问题,比如超买超卖3、做限流和高频计数器4、使用sorted set数据结构实现排行榜功能5、轻量级消息队列

BTAGService.dll文件丢失找不到问题 免费下载方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…