内卷还是变革?智谱唐杰最新演讲:大模型瓶颈期,普通人该如何抓住这3大趋势?

这个时候,可能大部分人都会把目光放到智谱的 CEO 张鹏身上,而我觉得唐杰可能是智谱成功最重要的一环。

唐杰老师是清华大学教授、智谱 AI 首席科学家,也是国内最懂大模型的人之一。

他在智谱上市前夕发了篇长微博,谈 2025 年对大模型的感悟。

有意思的是,唐杰和 Andrej Karpathy 的观察有不少共鸣,都在谈同一件事:AI 很火,但真正的变革还没到来。

AI 正在经历从“刷题学霸”到“职场打工人”的痛苦蜕变。


01 告别“理论博士”

Agent 才是从知识到生产力的惊险一跃

过去两年,我们迷信 Scaling Law(规模法则)。

唐杰老师明确指出:“更多数据、更大参数、更饱和的计算,依然是最高效的办法。”

这条路没走到头,还得继续卷。

但这不够。

当下的模型像什么?
像一个“偏科的学霸”

为了刷榜,它们疯狂做题,考试分很高。

但一扔到真实的复杂业务场景里,立刻抓瞎。

唐杰老师用了一个比喻:
“如果没有 Agent(智能体)能力,大模型就是个‘理论博士’。一个人书读得再多,哪怕读到了博士后,如果不能动手解决问题,那也只是知识的容器,产生不了生产力。”

Agent 是什么?
Agent 不是外挂几个工具那么简单,它是让模型从“纸上谈兵”进化到“下场干活”。

  • • 预训练(Pre-training) 是九年义务教育,给的是智商;
  • • Agent(智能体) 是职场实习,给的是执行力。

未来的竞争,不再是比谁读的书多(参数大),而是比谁能处理那些书本上没有的烂摊子(长尾场景)。

02 突破“记忆”瓶颈

AI 需要海马体,更需要“自我反思”。

你有没有发现,现在的 AI 记性其实并不好?

我们现在的“超长上下文”,本质上只是给 AI 发了一张更长的“便签纸”。

唐杰老师提出,AI 要想在真实世界生存,必须进化出像人类一样的四层记忆结构:

记忆阶段人类生理对应大模型技术对应
短期记忆前额叶上下文(Context)
中期记忆海马体检索增强生成(RAG)
长期记忆大脑皮层模型参数
历史记忆史书外部知识库

但比记忆更可怕的,是“在线学习”与“自我评估”

现在的模型是“离线”的,出厂设置决定一切。

如果说 Scaling Law 是第一代范式,那么“在线自进化”可能是下一个 Scaling 范式。

核心难题在于:模型不知道自己是对是错。

如果 AI 能像人类一样具备“自我反思”的能力,哪怕只是概率性地知道自己“刚才这句说错了”,它就有了自我优化的目标。

一旦模型学会了“吾日三省吾身”,AGI 的奇点可能就不远了。

03 极度残酷的商业真相

2026 年将是 AI 替代不同工种的爆发年

这一部分,可能会得罪很多人,但必须高亮加粗。

在谈到 AI 应用时,唐杰老师给出了一个判断:
“AI 模型应用的第一性原理不应该是创造新的 App,它的本质是 AGI 替代人类工作,因此研发替代不同工种的 AI 是应用的关键。”

这意味着什么?

如果你是创业者,别再想着做一个“AI+X”的工具 App 给用户用了。
你应该思考的是:我要造一个什么样的“AI员工”,能直接帮老板把某个岗位的“人力成本”砍掉?

  • • Chat 已经部分替代了搜索和初级助理;
  • • Coding Agent 正在替代初级程序员。

那“行业大模型”呢?
唐杰老师直言:“领域大模型是个伪命题。”

既然是 AGI(通用人工智能),就不该有“领域专用”之分。

所谓的“医疗大模型”、“法律大模型”,本质上是传统企业不敢直面 AGI 的海啸,试图用自己的领域修筑一道暂时的护城河,想把 AI 驯化为工具。

但 AI 的本质是海啸。

它走到哪里,就会把哪里的数据、流程、经验全部卷入主模型。

护城河终将被填平,所有领域最终都会被卷进 AGI 的世界。

结语:2026,重新设计一切

如果把唐杰老师的长文浓缩成一张图,我们看到了这样的未来:

  • 当下:继续卷 Scaling,但必须搞定“对齐”和“长尾”。
  • 近期:Agent 是生死门,模型必须学会“干活”。
  • 中期:攻克记忆和在线学习,让模型学会“自省”。
  • 长期:忘掉 App,忘掉领域模型,目标只有一个——工种替代。

对于我们每一个人来说,这意味着什么?

这意味着,“会用 AI 工具” 已经不够了。

AI 不是锦上添花的效率工具,它是重新定义游戏规则的基础设施。

正如19世纪的工厂主,面对蒸汽机时,不应该思考“怎么给我的马车装上蒸汽机”,而应该思考“怎么重新设计工厂”

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1136730.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SMBus协议层次结构:系统学习物理层与命令层

深入理解SMBus:从物理层到命令层的系统级解析在嵌入式系统和现代计算机架构中,我们常常需要让多个小功能芯片“说同一种语言”——比如温度传感器上报数据、电池管理IC报告剩余电量、内存模块自述规格。这些看似简单的任务背后,离不开一条低调…

企业级域名 SSL 证书信息采集与巡检

背景 在当前数字化时代,SSL 证书是保障企业网络传输安全、验证网站身份及维护用户信任的基石。尤其对于拥有众多域名的企业而言,SSL 证书的有效性直接关系到业务的连续性与安全性。传统手动管理方式难以应对证书数量多、易遗漏的挑战,证书一…

企业级域名 SSL 证书信息采集与巡检

背景 在当前数字化时代,SSL 证书是保障企业网络传输安全、验证网站身份及维护用户信任的基石。尤其对于拥有众多域名的企业而言,SSL 证书的有效性直接关系到业务的连续性与安全性。传统手动管理方式难以应对证书数量多、易遗漏的挑战,证书一…

学长亲荐8个AI论文软件,助你搞定本科生论文格式规范!

学长亲荐8个AI论文软件,助你搞定本科生论文格式规范! 论文写作的“隐形助手”:AI 工具如何改变你的学术之路 对于许多本科生来说,撰写论文不仅是对知识的检验,更是对时间管理、逻辑思维和语言表达能力的综合挑战。尤其…

保姆级教程!AI智能体的可解释因果缰绳全解析:手把手带你用大模型提取因果反馈。

文章摘要 本文介绍了一种创新的方法,利用大语言模型(LLM)代理从原始文本中自动提取因果反馈模糊认知图谱(FCM)。通过三步系统指令,LLM能够系统性地识别文本中的关键概念和因果关系,构建动态系统…

图解说明时序逻辑电路的信号时序关系

时序逻辑电路的信号时序关系:从波形图看懂触发器如何“记住”时间你有没有遇到过这样的情况?明明逻辑设计完全正确,Verilog代码也综合通过了,仿真看起来也没问题——但烧进FPGA后系统就是不稳定,偶尔出错、数据跳变、状…

上拉电阻与信号完整性的关系:深度剖析典型应用

上拉电阻的“隐形战场”:小阻值如何左右信号命脉?你有没有遇到过这样的场景?IC通信时断时续,示波器一测发现时钟边沿像“爬楼梯”;系统莫名其妙反复重启,查遍电源和固件却毫无头绪;两个电压域的…

ARM7异常处理调试技巧:超详细版日志追踪方法

ARM7异常调试实战:一套真正能用的日志追踪方案你有没有遇到过这样的情况?设备在现场莫名其妙重启,连不上仿真器,又无法复现问题。翻遍代码也找不到线索,只能靠猜——是不是栈溢出?中断冲突?还是…

一文说清波形发生器核心要点:初学者快速理解指南

从零搞懂波形发生器:不只是信号源,更是电子系统的“发令枪”你有没有遇到过这种情况——调试一个放大电路时,手头没有信号源,只能靠MCU的PWM勉强凑合?或者在做音频滤波实验时,发现输出波形“毛刺”满屏&…

pjsip VoIP通信入门必看:手把手搭建第一个通话应用

手把手教你用 pjsip 搭出第一个 VoIP 通话应用:从零开始的实战指南你有没有想过,自己动手写一个能打电话的程序?不是用微信、不是走运营商,而是真正通过网络传输声音——哪怕只是两台电脑之间“喂喂”两声。这听起来像是黑科技&am…

MicroPython定时器工作原理通俗解释

让你的MicroPython“会看时间”:定时器工作原理全解析你有没有试过用time.sleep(3)暂停程序三秒,结果发现这期间按钮按了没反应、Wi-Fi收不到消息?这是初学者最容易踩的坑——阻塞式延时让整个系统“死机”了。那怎么才能一边等时间&#xff…

SPI通信项目中遇到c9511e错误的环境修复操作指南

SPI项目编译卡死?一招解决c9511e: unable to determine the current toolkit环境故障你有没有经历过这样的场景:SPI驱动写得行云流水,DMA双缓冲配置得天衣无缝,信心满满一点“Build”——结果编译器弹出一行红字:error…

利用Elasticsearch向量检索提升推荐准确率:深度剖析

用 Elasticsearch 做向量推荐?我们踩过这些坑,也拿到了真实收益你有没有遇到过这样的场景:用户刚看完一款降噪耳机,系统却给他推了个电饭煲?新上架的商品连续一周没人点开,后台数据显示“曝光为0”&#xf…

从零开始的Git生活 | 刚实习同学的噩梦 And 参与开源不可缺的一环

一、Git初识 Git 是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目。是 Linus Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。Git 与常用的版本控制工具 CVS, Subversion 等不同,它采用了分布式版本库…

CANoe中uds31服务异常处理机制:全面讲解

CANoe中UDS 0x31服务异常处理实战:从协议到代码的深度解析你有没有遇到过这样的场景?在用CANoe做ECU刷写测试时,明明脚本逻辑清晰、参数无误,但uds31服务却频频报错——不是返回NRC0x22(条件不满足)&#x…

分布式存储:大数据领域的关键支撑

分布式存储:大数据领域的关键支撑 关键词:分布式存储、大数据、数据分片、副本机制、一致性协议、横向扩展、高可用性 摘要:在数据量以“ZB”为单位增长的今天,传统单机存储早已无法满足需求。分布式存储就像数字世界的“超级图书馆”,通过多台机器协作,解决了海量数据存…

arm版win10下载下UWP应用侧载安装操作指南

在ARM版Windows 10上侧载UWP应用:从入门到实战你有没有遇到过这种情况?手里的Surface Pro X明明性能不弱、续航惊人,打开Microsoft Store却发现很多常用软件“此设备不支持”——尤其是那些没为ARM64编译的UWP应用。更别提一些内部测试工具、…

实战案例:多版本共存后Vivado的选择性卸载策略

如何安全卸载特定版本的Vivado?——一位FPGA工程师的实战避坑指南你有没有遇到过这种情况:服务器磁盘突然告警,df -h一看,根分区用了95%以上,而排查下来最大的“元凶”竟然是三个不同版本的Vivado?更糟的是…

Artix-7平台VHDL数字时钟的复位与时钟管理方案

Artix-7平台VHDL数字时钟的复位与时钟管理实战解析你有没有遇到过这样的情况:FPGA系统上电后,数码管显示乱跳、时间计数错乱,甚至状态机直接“跑飞”?明明逻辑写得没问题,仿真也通过了,可一到板级运行就出问…

巧取视图中的所有文档

大家好,才是真的好。 最近用AI写了点LotusScript,表面上强烈地感受到它的工作能力很好很强大,周到又心细。但一运行,全是报错,因为里面用了不少AI自己编写(幻觉)的属性或方法,例如我…