全球AI大模型第一股从入门到精通:市值超600亿,清华系的硬核逆袭,收藏这一篇就够了!

昨天,智谱AI(02513.HK)在香港交易所主板正式挂牌交易,成为全球首家以通用人工智能(AGI)基座模型为核心业务的上市公司。

智谱AI的上市首日表现亮眼,开盘价为120港元/股,最终收盘价达130港元/股,较发行价116.2港元上涨12%,总市值突破574亿港元。

今天持续走高,已暴涨至156.7港元/股,总市值高达689亿元,创造了中国AI领域的新纪录。

智谱AI的诞生,从清华实验室到创业新星

智谱AI的根源,可以追溯到近三十年前清华大学孕育的一段学术梦想。1996年,清华大学计算机系成立了知识工程实验室(KEG),这是国内最早开展自然语言处理(NLP)和知识图谱研究的实验室之一。

在这个实验室里,一群对人工智能充满热情的年轻人开始探索让机器理解和思考的道路。

唐杰,这位日后成为智谱AI灵魂人物的年轻学者,正是在KEG实验室中完成了他的博士学业,并逐渐成长为领域内的领军人物。

2006年,唐杰带领KEG团队发布了一款名为“AMiner”的科研情报挖掘系统。这个系统通过人工智能技术分析自然科学或技术发展的客观规律,构建了早期的知识图谱框架,为日后智谱AI的技术积累埋下了第一颗种子。

AMiner的问世并非偶然,它源于唐杰对当时科研环境的敏锐洞察:当谷歌学术已成为全球研究者的标配时,中文世界却缺乏一个同等效能的学术引擎。怀揣着独创中国人自己的技术的理想,唐杰和他的团队用行动填补了这一空白。

AMiner的成功让唐杰积累了丰厚的科研资本,也为智谱AI的诞生奠定了基础。从2013年开始,AMiner的商业化应用被提上日程,为国内的科研机构、科技企业等提供服务。

这种“带着客户和市场启动”的务实风格,从一开始就刻入了智谱AI团队的DNA。2019年,在国家相关政策的鼓励与支持下,清华大学教授李涓子、唐杰等人依托AMiner为基础,共同创立了智谱AI。

北京智谱华章科技有限公司正式注册成立,由清华大学的技术成果转化而来,致力于打造新一代认知智能通用模型。

智谱AI的创始班底堪称“全明星”阵容,汇集了KEG实验室的核心成员和清华系的顶尖科学家。

唐杰担任首席科学家,另一位清华校友刘德兵出任董事长,负责战略及业务方向。而公司的CEO则由张鹏担任。

张鹏同样毕业于清华大学计算机系,曾参与设计国内首个中英文平衡的跨语言知识图谱系统XLORE,是KEG实验室的核心成员之一。

这种前沿研究与商业落地并重的特质,从智谱AI创立之初就贯穿于其发展脉络中。成立当年,智谱AI就获得了4000万元人民币的天使轮融资,投资方包括清华大学资管和中科创星。

这笔资金为公司启动研发提供了“第一桶金”。更难能可贵的是,智谱AI从成立第一天起就拥有稳定的收入来源,这为其早期的大模型研发赢得了宝贵的缓冲时间。

公司依托KEG实验室的技术积累,为科技情报分析和数据挖掘提供解决方案,在创立初期便实现了“自带干粮”的创业模式。

从0到1的艰辛抉择

智谱AI的创业之路并非坦途,早期的发展充满了艰难的抉择和考验。2020年,全球AI行业迎来了一个重要的转折点。当年6月,OpenAI发布了震撼业界的GPT-3模型,其强大的生成能力让整个AI界为之震动。唐杰和张鹏等智谱AI的创始团队敏锐地意识到,大模型将是未来发展的方向。

然而,摆在智谱AI面前的是一个艰难的选择:是追随西方主流的技术路线,还是自主开辟一条属于自己的道路?

当时,国内市场对大模型的关注度极为有限,整个行业仍处于“前夜”阶段。OpenAI的GPT系列和谷歌的BERT架构分别代表了两种主流路径。GPT采用自回归的Transformer架构,擅长文本生成;

而BERT采用双向编码器(BidirectionalEncoder)架构,在理解上下文方面表现优异。

智谱AI团队没有简单地选择其中任何一条路线,而是做出了一个大胆的决定:从0起步,自主研发全新的预训练架构。

这个选择在当时看来并不显眼,甚至带有一定的“冒险”色彩。毕竟,追随OpenAI或谷歌的道路,意味着可以站在巨人的肩膀上,风险相对可控;而自研架构则是一条充满未知的道路,需要投入更多的人力、财力和时间。

然而,唐杰和张鹏等团队核心成员深知,要打破西方的技术垄断,实现中国在大模型领域的自主可控,就必须走出一条自己的技术路线。这种对自主创新和技术报国的执着,成为驱动智谱AI早期发展的核心动力。

2020年底,智谱AI正式开启了“悟道”项目的研发,全力投入大模型的开发。这一决策在当时并不被广泛看好,甚至遭到了内部一些工程师的质疑和反对。在2021年底的一次关键会议上,面对投入千万级的巨资可能让公司覆灭的风险,工程师们沉默以对,以示反抗。

此时的唐杰,作为公司的灵魂人物,展现出非凡的理想主义和战略定力。他坚定地表示,如果成功,至少证明中国的大模型公司,技术能力也能达到世界级水平。

他更宏大的目标是打破西方技术路径,打造中国自己的预训练模型框架。这一豪赌,最终将智谱AI带向了一个全新的高度。

ChatGPT问世后,AI大模型进入飞速发展

2022年11月30日,ChatGPT的横空出世,彻底改写了全球AI行业的节奏。ChatGPT凭借其强大的对话能力和惊艳的用户体验,瞬间引爆了市场,大模型从一个“冷门”的学术概念,变成了大众热议的焦点。

对于智谱AI而言,这既是巨大的机遇,也是前所未有的挑战。幸运的是,智谱AI在此前的技术先发优势使其能够迅速响应这场突如其来的AI革命。

早在ChatGPT发布前的2021年,智谱AI就训练出了百亿参数规模的模型GLM-10B,并利用混合专家(MoE)架构成功训练出收敛的万亿稀疏模型,技术实力初露锋芒。

更令人瞩目的是,2022年8月,智谱AI合作研发了中英双语千亿级超大规模预训练模型GLM-130B,并率先开源。这一时间点,比ChatGPT的发布早了整整三个月。

斯坦福大学大模型中心在2022年11月对全球30个主流大模型进行的评测中,GLM-130B成为亚洲唯一入选的大模型,充分证明了其技术实力。

ChatGPT的爆火,让大模型从一个“难落地”的前沿技术,变成了资本追逐的“香饽饽”。一夜之间,AI大模型赛道从冷清变得拥挤不堪,国内很快掀起了“百模大战”的热潮。

对于智谱AI而言,这既是证明自己的绝佳机会,也意味着竞争环境的急剧恶化。公司迅速进入了高速迭代期,模型发布的频率从“几年磨一剑”提升到了“每3个月一次”。

2023年3月14日,GPT-4发布的同一天,智谱AI推出了对标产品ChatGLM,并同步开源了参数规模仅60亿的ChatGLM-6B模型。这一时间节点的选择,被外界解读为一种“隔空叫板”的意味。

紧接着,智谱AI在同年6月和10月又先后推出了ChatGLM2和ChatGLM3,不断刷新着自己的技术纪录。

8月,智谱AI推出的生成式AI助手“智谱清言”成为首批通过大模型备案的产品,正式面向公众开放服务。这些快速迭代的举措,使智谱AI在“百模大战”中占据了先发优势。

随着产品能力的提升和开源策略的推行,资本市场的热情也空前高涨。2023年,智谱AI累计获得了超过25亿人民币的融资,投资方阵容豪华,包括社保基金中关村自主创新基金、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来等众多知名机构,以及君联资本、启明创投等老股东。

这一年,智谱AI的估值从B1轮融资前的19亿元飙升至B6轮融资后的244亿元,完成了从初创公司到“独角兽”的华丽转身。资本的涌入为智谱AI加速技术研发和市场拓展提供了充足的“弹药”。

高增长与高亏损并行的现实

尽管智谱AI在技术和融资上取得了令人瞩目的成绩,但其商业化之路却并非一帆风顺。随着“百模大战”进入白热化,一个残酷的现实摆在所有大模型公司面前:如何将技术优势转化为可持续的商业回报?

智谱AI的财务数据清晰地描绘出一家典型AI大模型创业公司的画像:收入增长迅猛,但亏损同样巨大。

根据招股书披露,2022年至2024年,智谱AI的收入分别为5740万元、1.245亿元和3.124亿元,年复合增长率高达130%。

进入2025年,这一增长势头更为强劲,上半年收入达到1.91亿元,同比增长325%。

然而,同期公司的净亏损也迅速扩大:2022年至2024年,经调整后的净亏损分别为0.97亿元、6.21亿元和24.66亿元,三年累计亏损超过30亿元。2025年上半年,净亏损进一步扩大至23.58亿元。

巨额亏损的主要原因,是持续高强度的研发投入。2022年至2024年,智谱AI的研发投入分别为8440万元、5.289亿元和21.954亿元,2025年上半年更是高达15.947亿元,累计研发投入约44亿元,是同期营收的8倍以上。

截至2025年6月,公司研发人员占比高达74%,接近八成的员工都在从事技术工作。这种“烧钱换技术”的模式,与OpenAI、Anthropic等美国同行如出一辙,是AI大模型领域普遍面临的共同挑战。

AI群雄,逐鹿新战场

智谱AI敲响的上市钟声,不仅是自身发展的里程碑,更映射出中国大模型行业格局的深刻变革。曾经风光无限的“AI六小虎”:智谱AI、MiniMax、百川智能、月之暗面、零一万物和阶跃星辰,正经历一场剧烈的分化。

2025年初, DeepSeek的横空出世,以“低成本+高智能+全开源”的颠覆性模式,迅速成为全球焦点。以免费开源的策略获得了开发者社区的广泛支持,对包括智谱AI在内的所有商业模型公司构成了生态级的挑战。

与此同时,字节跳动和阿里两大互联网巨头全面下场,投入巨额资金布局AI基础设施和自研大模型。

字节跳动2026年的资本开支规划约1600亿元人民币,其中约850亿元用于AI芯片;阿里则启动了“三年3800亿”的新基建计划。

在人才争夺上,头部大厂更是不计成本,据行业报告,字节跳动已成为国内AI人才的头号金主,“六小虎”体系内2025年上半年有超过10位核心高管离职,不少加入了大厂阵营。

在这样的背景下,中国大模型市场的竞争格局正加速重塑。曾经追逐通用大模型的创业公司,不得不开始思考如何与巨头“共舞”。

零一万物已退出基础模型竞争,预训练团队整体并入阿里通义;百川智能转向医疗等垂直领域;月之暗面和MiniMax专注C端产品;阶跃星辰则在B端和C端同时布局。

有行业人士认为,最终能持续参与基础大模型竞争的玩家可能收敛为“基模五强”。DeepSeek、阿里、字节、阶跃和智谱。而更有预测称,中国最终只会剩下三家大模型公司。

面对巨头环伺和新兴对手的冲击,智谱AI选择了加码预训练投入,坚持走通用大模型的道路。

2025年下半年,智谱AI连续发布了GLM-4.5、GLM-4.6和GLM-4.7三代模型,技术性能不断攀升。GLM-4.5被定位为首款原生Agent基座模型,在12个评测基准中取得全球第三、国产第一的成绩。

GLM-4.6在真实环境编码测试中达到了与AnthropicClaudeSonnet4相当的水平,200K的超长上下文窗口较行业主流的128K提升了56%。

而最新的GLM-4.7模型,在全球百万用户盲测的CodeArena上与Anthropic、OpenAI的模型并列编码全球第一,超越了谷歌的Gemini和xAI的Grok。

这些技术上的激进姿态,为智谱AI赢得了外界的广泛认可,也为其在竞争中增添了更多底气。

智谱AI的上市,是敲响AI时代的钟声,更是新征程的起点。在敲钟仪式后的内部信中,创始人唐杰写道:“我们不是敲钟,我们只是拿到了下一场硬仗的入场券。”

这句话深刻揭示了智谱AI团队的清醒认知:上市并非终点,而是新的开始。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1136797.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

‌Web API测试工具与技巧

一、核心工具演进:2025–2026年主流平台能力升级‌2025年以来,API测试工具已从“调试器”全面进化为“全生命周期协作平台”。以下为当前行业主流工具的核心能力跃迁:工具2025–2026年关键升级对测试工程师的价值‌Postman‌集成AI辅助测试生…

工业高温环境下的温度传感器稳定性分析:深度剖析

工业高温环境下的温度传感器稳定性分析:从原理到实战的深度拆解在钢铁厂的熔炉旁,在化工反应釜的监控室里,或是航天发动机试车台上——你总能看到一根根金属探头深入烈焰与高温之中,默默记录着那关乎生产安全与工艺成败的关键数据…

一文说清screen命令的会话分离与恢复机制

会话永不掉线:深入理解 screen 的分离与恢复机制你有没有过这样的经历?深夜通过 SSH 登录服务器,启动一个数据迁移脚本,刚准备去泡杯咖啡,结果网络一抖,终端断开——再连上去时,进程早已消失无踪…

在GNU Radio中利用SDR实现AM解调项目应用

用 GNU Radio 和 SDR 打造你的数字 AM 收音机:从原理到实战你有没有想过,花不到一张电影票的钱,就能搭建一个能接收中波广播的软件无线电系统?而且不只是“听”,还能实时看频谱、调参数、分析信号质量——这正是软件定…

OTG主机模式与传统主机的区别与联系

OTG主机模式:当手机也能当“电脑”用你有没有试过在户外拍完照片,急需把SD卡里的素材导入设备预览,却发现没带笔记本?或者想用游戏手柄玩平板上的大型手游,却不知道怎么连接?这时候,一根小小的O…

‌移动测试在5G环境中的系统性挑战与实践演进

‌一、5G三大核心特性对测试范式的颠覆性重构‌5G不再仅仅是“更快的4G”,而是通过‌增强移动宽带(eMBB)‌、‌超可靠低延迟通信(URLLC)‌ 和 ‌大规模机器类通信(mMTC)‌ 三大场景,…

AI大模型点燃传媒股从入门到精通:一文读懂爆发背后的逻辑,收藏这一篇就够了!

1月9日,A股市场持续火爆,沪指时隔十年重新登上4100点。商业航天、可控核聚变、有色金属、机器人等热点板块延续强势;AI应用概念板块领涨全市。 传媒股纷纷大涨 午后,A股市场,AI应用端侧的概念股更是全面爆发。东方财…

AI大模型实用价值从入门到精通:又一成功案例全解析,收藏这一篇就够了!

说到AI有很大实用价值,笔者最喜欢举的例子,就是笔者亲身用AI大模型SUNO创作歌曲,从一个纯粹的门外汉,短短两年时间成为创作了200首作品的音乐创作者,其中许多作品被网友和朋友称赞好听。 不过这篇文章不讲音乐创作&am…

【程序员必看】大模型微调实战:LLaMA Factory+Ollama打造专属AI助手(建议收藏)

文章详细介绍了大模型微调的概念、方法和实践流程。解释了微调相较于训练完整大模型的成本优势,介绍了微调的基本步骤:数据准备、模型训练、评估和使用。重点讲解了如何使用LLaMA Factory工具进行微调,包括数据格式准备、模型配置和训练过程。…

项目应用中UDS诊断协议会话控制异常处理策略

UDS诊断会话控制为何总失败?一位嵌入式工程师的实战排坑笔记最近在调试一款新能源车的OTA升级流程时,我连续三天被同一个问题卡住:诊断仪每次尝试进入编程会话都失败,返回NRC 0x22 – Conditions not correct。重试十次能成功一两…

解析minidump是什么文件老是蓝屏的常见原因(新手教程)

蓝屏总弹出?别慌!读懂 minidump 文件,自己动手查根源(新手也能懂的实战指南) 你有没有遇到过这样的情况:电脑用得好好的,突然“啪”一下蓝屏重启,接着又自动进入系统,仿…

测试数据模拟在移动端应用:从基础到实战指南

移动端测试的变革与数据模拟的崛起 在2026年的移动应用生态中,用户量激增和设备碎片化(如折叠屏手机和IoT集成)加剧了测试复杂性。测试数据模拟(Test Data Simulation)作为关键赋能技术,通过生成可控、安全…

Keil中文乱码怎么解决:从零开始的完整示例教程

Keil 中文乱码?别急,一招搞定从根源到实战的完整解决方案你有没有遇到过这种情况:刚写完一段带中文注释的代码,保存后重新打开——满屏“ˆ™‘Š”?或者团队协作时,同事发来的工程文件里中文全变“豆腐块”…

移动端自动化测试失败处理指南

移动端自动化测试已成为现代软件开发的核心环节,它能显著提升测试效率并确保应用质量。然而,随着设备碎片化、操作系统多样性和网络环境复杂性的加剧,测试失败频发成为测试团队的重大挑战。据统计,超过60%的自动化测试项目因失败处…

OpenAI 效仿Meta,在ChatGPT中引入基于记忆的广告模式!

OpenAI 考虑在 ChatGPT 引入广告,以缓解收入压力并加速商业化 尽管估值高达约5000亿美元,并计划在未来一年投入数十亿美元,OpenAI 仍面临收入来源单一的挑战。据《金融时报》报道,ChatGPT 全球用户已突破8亿,但付费用…

腾讯云渠道商:腾讯云 CVM 怎么手动搭建 WordPress 个人站点(Linux)?

一、引言在个人博客、作品集展示等场景中,WordPress 凭借其易用性和丰富插件成为首选。腾讯云 CVM 提供稳定高效的 Linux 云服务器,是搭建 WordPress 的理想选择。本文以极简流程为核心,避开复杂代码,助您 30 分钟快速建站。二、腾…

基于springboot旅游管理系统

基于SpringBoot的旅游管理系统是利用SpringBoot框架开发的、服务于旅游行业的信息管理平台,旨在通过信息化手段提升旅游服务效率与用户体验,满足用户和管理员的多样化需求。以下从系统架构、功能模块、技术优势、应用场景四个方面进行详细介绍&#xff1…

Golang语法进阶(并发概述、Goroutine、Channel)

文章目录并发概述1.进程与线程2. 协程3. 并行与并发GoroutineGoroutine使用主协程多协程调用ChannelChannel是什么channel初始化channel操作判定读取For range读取双向channel和单向channel定义单向读channel定义单向写channel解决什么问题?扩展关于channel的几点总…

‌移动App用户体验(UX)测试技巧:专业指南与实战策略

UX测试在移动App中的核心地位‌在2026年的数字生态中,移动App已成为用户交互的主要入口,用户体验(UX)质量直接决定产品成败。对于软件测试从业者而言,UX测试不再是可有可无的附加项,而是确保App竞争力、用户…

深入浅出讲解ModbusTCP报文封装与解码过程

深入拆解ModbusTCP报文:从封装到解析的实战全路径在工业自动化现场,你是否曾遇到过这样的场景?一台PLC明明通电正常,HMI却始终读不到数据;抓包工具里看到一串十六进制数来回传输,但就是不知道哪里出了问题。…