大模型术语全解析:从LLM到Agent,小白必学指南

文章系统介绍了大模型领域的核心术语,包括LLM(参数规模≥1B的语言模型)、MCP(连接外部数据的标准化协议)、Agent(结合LLM和工具实现任务的智能体)、RAG(减少模型幻觉的检索增强生成)、LangChain(开发框架)、vLLM(通过KV Cache和连续批处理提高效率)等关键技术概念,帮助读者建立大模型知识体系。


写在前面

大模型在今年的热度可以说是现象级的。从年初Deepseek ,Manus的爆火出圈到日常app中都能看到大模型的身影。

这篇文章我们就来梳理一些关于大模型的术语,包括LLM、MCP、RAG、Agent、LangChain、vLLM、蒸馏等等。

LLM

Large Language Model 大模型,模型多大才被称为大模型并没有统一硬性标准,但行业通常以参数规模和训练数据/算力来衡量,语言模型常在≥1B参数开始被称为“大模型”。比如:

  • GPT-2 有 1.5B,早期较大的语言模型
  • GPT-3 有 175B

这里1B的B是Billion的意思,也就是参数的个数,1B=10亿,一共有10亿个参数的模型就会被称为大模型。

prompt

prompt 提示词,也就是我们输入给大模型的语句。

MCP

Model Context Protocol(模型上下文协议):是一个开放协议,目的是为 LLM应用提供一个标准化接口,使其能够连接外部数据源和各种工具进行交互

核心在于建立一个标准化的通信层,使得 LLM 能够在处理用户请求或执行任务时,如果需要访问外部信息或功能,可以通过 MCP Client 向 MCP Server 发送请求。

MCP Server 则负责与相应的外部数据源或工具进行交互,获取数据并按照MCP协议规范进行格式化,最后将格式化后的数据返回给大型语言模型。

但我们注意一点,大模型是不会自己去调用外部数据源或者工具的,大模型只会告诉我们需要调用哪些工具,而我们需要自己去实现工具的调用。

我们把大模型和MCP融合之后就会出现一个新名字叫智能体 Agent。

Agent

Agent智能体,我们上面说了大模型只会给我们一个步骤方法,不会真正去执行步骤。比如发邮件,大模型只会给出如何发邮件,第一步xxx,第二步xxx。并不会实际帮我们去发邮件,而我们需要把 LLM 整合上 MCP 工具才会真正实现发邮件。

具体流程:

  1. 给大模型输入提示词:“请帮我给xxx发送一封邮件,告诉他快点更新视频”,并将发邮件的工具 Tool 告诉大模型。
  2. 大模型会根据工具 Tool 给出一系列的步骤,包括调用什么工具 ToolName,以及调用工具的参数 Args。eg: ToolName = ‘email_sender’、Args = ‘email:xxx, content:快更视频’。
  3. 我们会将这些参数给到 mcp server。
  4. mcp server 再进行发送邮件。
  5. 将结果返回告知用户。

RAG

Retrieval-augmented generation (RAG)检索增强生成。在用大模型的时候,大家会发现大模型总是一本正经的回答问题,但其实是在胡说八道,这种现象叫hallucination幻觉。大模型本质的就是不断的预测下一个生成的文字应该是什么,而选择预测概率中最大的一个。打个比方:LLM 在考试的时候面对陌生的领域,只会写一个解字(因为LLM复习也只是局限于特定的数据集),然后就准备放飞自我了,而此时RAG给了亿些提示,让LLM懂了开始往这个提示的方向做,最终考试的正确率从60%到了90%!

RAG的过程如下:之前的文章已经详细介绍RAG了,感兴趣可以翻一翻~

embedding

embedding 向量化,在大模型中,我们一个词表达意思可能会有区别,比如苹果既可以代表水果,也可以代表手机,所以某个词是什么意思取决于这个词所在的语境是什么。

我们怎么知道词与词之间有没有关联呢?我们可以词转化成一连串的浮点型数字,去计算词与词之间的距离

embedding

举个例子:

我们可以看到单词向量化后就变成了浮点型,在坐标轴上画上这些坐标我们可以很直观的看到:一百和两百的距离近,而一百离一千远,所以一百相比于一千,更接近两百这个语意。

LangChain

LangChain 是一个快速实现 agent 的开发框架,提供了标准接口,用于将不同的LLM连接在一起,以及与其他工具和数据源的集成。

vLLM

vLLM 是虚拟大语言模型的简称,由 vLLM 社区维护的一个开源项目。为了让大语言模型(LLM)更高效地大规模执行计算,通过更好地利用GPU 内存来加快生成式 AI 应用的输出速度。最主要是两个模块:KV Cache和连续批处理。

KV Cache:

这里的 K 和 V 是由每个 token 的向量化后通过线性变换得到的两类向量,用来做注意力计算KV Cache 把这些历史 K/V 保存下来,后续步不用重复计算。但 KV Cache 随上下文长度、层数、头数、维度线性增长,也变成推理中的最大显存开销之一。

vLLM 的做法:

  • 分块:用 PagedAttention 将每条序列的 KV Cache 切分为固定大小的块(block),并用页表式映射管理它们,像操作系统的虚拟内存一样灵活调度。这样避免了按序列分配一大块连续内存导致的碎片化和 OOM,同时支持动态并发与复用。
  • 复用与共享:在多分支(如 beam search)和重复前缀场景下,可复用相同前缀产生的 KV 块,极大减少预填充(prefill)时间。

分block

连续批处理:

  • 不是攒满一批再跑,而是在每个解码步骤(按 token 迭代)都把活跃请求组装成一个批,序列长度不同也能高效合批,GPU 基本满负载运转。减少短任务被长任务阻塞的头阻塞,提高并发与公平性;
  • 基于PagedAttention 的块式内存 + 步进级调度器,无需等待整批结束即可把新的请求插入下一步的批次。

Token

Token 是大模型各种算法的基本输入单元,可以认为是一个单词或者一个短语。一般来说:

  • 1 个英文字符 ≈ 0.3 个 token。
  • 1 个中文字符 ≈ 0.6 个 token。

token

数据蒸馏

Data Distillation 数据蒸馏,利用一个高性能的大模型生成精简但有价值的数据,使得一个小模型可以从中学习并逼近大模型的效果。

AI大模型从0到精通全套学习大礼包

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!

如果你也想通过学大模型技术去帮助就业和转行,可以扫描下方链接👇👇
大模型重磅福利:入门进阶全套104G学习资源包免费分享!

01.从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

02.AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线


03.学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的


04.大模型面试题目详解

05.这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!


如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1220672.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MCP:大模型界的Type-C标准,让你的工具一次编写到处运行(深度好文,值得收藏)

文章介绍了MCP(模型上下文协议)作为大模型界的"Type-C"标准,解决了不同模型间工具不通用的问题。通过MCP,开发者可以创建统一格式的工具接口,使大模型能够执行绘画、搜索、文件操作等传统代码能力&#xff0…

Ollama大模型开发实战:从基础到高级功能的全面指南

本文全面介绍了Ollama大模型平台的核心功能与开发技巧,包括流式处理三种模式、CLI命令使用、Pydantic定义JSON结构、向量嵌入应用、Agent多轮工具调用以及Web Search API集成。通过丰富代码示例和最佳实践指导,帮助开发者掌握从基础到高级的Ollama应用开…

从入门到精通:RAG生产级实战指南 | 大模型应用必备收藏

本文全面介绍RAG从概念验证到生产落地的技术指南,详细解析知识库构建、检索增强、生成推理等关键环节,涵盖文档处理、Embedding模型选型、混合检索架构、Prompt工程、评估监控及成本优化等实战内容。文章强调RAG成功取决于工程细节而非模型本身&#xff…

大模型开发工程师年薪90万不是梦!零基础入门到高薪就业的完整攻略(附资料包)

大模型应用开发工程师市场需求激增,岗位需求同比增长超200%,应届生年薪可达90万。该岗位主要负责API对接、Prompt设计、模型微调和系统集成。入行需掌握Python、Transformer架构、Prompt工程、RAG系统及LangChain等框架。相比底层模型训练,应…

Java毕设项目:基于springboot的机器人健康预警系统(源码+文档,讲解、调试运行,定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

银源电力联系方式:企业信息查询与使用建议

一、官方联系方式 加盟咨询电话:13551886986 公司官方网站:www.scyydl.com 二、使用建议与提醒 首先,在进行任何商务联系前,建议访问其官方网站以获取最基础的企业信息与业务范围介绍。官方网站通常是了解一家公司…

【课程设计/毕业设计】基于JAVA+Vue+SpringBoot的个人健康管理系统健康档案、体检档案、健康咨询基于springboot的个人健康管理系统【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

2026最新K歌电视品牌top5推荐!家庭娱乐影音设备企业及厂家权威榜单发布,沉浸式K歌体验

引言 随着家庭娱乐场景不断升级,K歌电视凭借“大屏沉浸+专业音效+智能交互”的综合优势,成为现代客厅的核心娱乐终端。据中国电子视像行业协会(CVIA)最新数据显示,2025年国内K歌电视市场规模同比增长42%,但产品音…

Java计算机毕设之基于Springboot+MySQ基于springboot的个人健康管理系统基于SpringBoot + Vue的个人运动健康管理系统(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

蓝凌软件联系方式:官方路径与背景介绍

一、官方联系方式 联系电话:4000180300 公司官网:www.landray.com.cn 二、使用建议与提醒 首先,在联系前建议进行初步准备。可以访问蓝凌软件的官方网站,浏览其产品介绍、解决方案和成功案例板块,这有助于您更清晰…

【毕业设计】基于springboot的机器人健康预警系统(源码+文档+远程调试,全bao定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围::小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、pyth…

我的 OI 故事(二):世上本没有路

写在前面:本篇文章是我竞赛回忆录的第二篇,覆盖的时间范围为 \(2022\) 年三月至 \(2023\) 年三月。如果你想了解更多,可以阅读竞赛生涯回忆录《我的 OI 故事》预告。 文中出现的所有人物均已事先确认并同意被提及。…

提示工程架构中的意图识别优化

提示工程架构中的意图识别优化:让AI真正“听懂”用户的话 一、引入:当AI变成“听不懂话的服务员” 清晨的咖啡馆里,你对服务员说:“我要一杯热的,不加糖。” 服务员立刻回应:“好的,热美式不加…

银源电力联系方式:加盟咨询与官方信息指南

一、官方联系方式 加盟咨询电话:13551886986 公司官方网站:www.scyydl.com 二、使用建议与提醒 第一,在通过电话进行咨询前,建议访问其官方网站,对公司的业务范围、资质情况和经营理念进行初步了解。这有助于在沟…

伪爱加密企业 Frida反调试

本期受害者 中国移动 12.0.5 第一步 先去dump 目标so libexec.so 第二步 我们可以使用frida Stalker定位被杀死的位置: Interceptor.attach(JNI_OnLoad, {onEnter: function () {console.log("JNI_OnLoad 进入")const curTid Process.getCurrentThre…

蓝凌软件 联系方式:企业级AI服务咨询路径解析

一、官方联系方式 联系电话:4000180300 公司官网:www.landray.com.cn 二、使用建议与提醒 第一点,在通过官方电话进行咨询前,建议先访问其官方网站,对公司的业务范围、核心产品及服务案例进行初步了解。这有助于在…

2026最新100吋电视企业top5推荐!高品质品牌及厂家全面解析,技术创新与画质体验双优助力家庭观影升级

引言 随着大屏显示技术的快速迭代与家庭娱乐需求的持续升级,100吋电视已成为高品质生活的重要组成部分,但市场产品良莠不齐,消费者常面临画质真实性、系统流畅度、安装适配性等选择难题。据中国电子视像行业协会(C…

怎么做一个微信小程序?10年程序员分享一个0代码教程

你好,我是专门做小程序开发的程序员,在这行已经干了10年。经手过上百个小程序项目,从餐饮零售到教育服务,各种类型都摸透了。根据腾讯2023年财报显示,微信小程序日活跃用户已突破6亿,年交易规模超4万亿(来源:腾…

蓝凌软件联系方式:获取官方信息指引

一、官方联系方式 联系电话:4000180300 公司官网:www.landray.com.cn 二、使用建议与提醒 第一,在联系前进行初步准备。建议访问蓝凌软件的官方网站,浏览其产品介绍、解决方案和成功案例板块,以便对公司的业务范围…

河南精铸工匠不锈钢有限公司 联系方式:如何有效联系与初步沟通

河南精铸工匠不锈钢有限公司是一家专注于不锈钢标识产品与装饰工程解决方案的企业。以下是根据其公开信息整理的官方联系渠道、使用建议以及公司背景简介,供您参考。 一、官方联系方式 联系电话:18595537533 公司名称…