震惊!DeepSeek仅花560万碾压OpenAI,2025中国大模型技术全解析,程序员必看!

1月

DeepSeek R1震撼发布,重塑全球AI格局

1月20日,深度求索发布开源推理模型DeepSeek R1,性能比肩OpenAI o1,训练成本仅约560万美元。模型迅速登顶全球应用商店榜首,引发美股震荡,英伟达市值一度蒸发近6000亿美元。DeepSeek以极低成本实现顶尖性能,美国硅谷风险投资者马克·安德里森(Marc Andreessen)称此是「AI领域的Sputnik时刻」,彻底打破算力至上的传统范式。

1月

阿里云发布通义千问旗舰版模型Qwen2.5-Max

2025年1月,阿里云发布通义千问旗舰版模型Qwen2.5-Max,这是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了当时全球领先的开源MoE模型以及最大的开源稠密模型。同月28日,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本,能够更准确地解析图像内容,突破性地支持超1小时的视频理解。

3月

百度发布文心大模型4.5和X1

3月16日,百度发布文心大模型4.5和X1并免费开放。文心4.5是新一代原生多模态基础大模型,多模态能力优于GPT-4o,API价格仅为竞品1%;文心X1是首个自主运用工具的深度思考模型,可调用搜索、绘图、代码等多款工具。6月30日,百度正式开源文心4.5系列共10款模型,标志着百度从闭源走向开源的重大转变。

4月

阿里通义千问Qwen3系列全面开源

4月,阿里云发布并开源通义千问Qwen3系列,一次性推出8款开源模型,涵盖多种参数规模。此前3月已开源QwQ-32B推理模型,性能比肩DeepSeek-R1。Qwen系列在Hugging Face下载量持续领先,成为全球最受欢迎的开源大模型之一,奠定阿里在开源大模型生态的领军地位。

5月

DeepSeek发布R1-0528版本更新

2025年5月28日,DeepSeek发布DeepSeek-R1-0528版本更新。虽然官方称其为"小版本升级",但实测性能大幅提升,在LiveCodeBench等基准测试上几乎与OpenAI o3-high相当。新版本在编程能力方面有显著优化,能够解决此前难倒多款顶流大模型的数字难题,模型权重继续以MIT协议开源。

5月

华为发布盘古Ultra MoE

5月30日,华为重磅推出参数规模高达7180亿的全新模型——盘古Ultra MoE,这是全流程在昇腾AI计算平台上训练的准万亿MoE模型,标志着基于昇腾架构可打造世界一流大模型,实现从硬件到软件的全栈国产化闭环。

7月

字节跳动豆包1.6发布,市场份额达46.4%

6月,字节跳动发布豆包大模型1.6版本,日均Token使用量较去年增长137倍。根据IDC数据,豆包在中国公有云大模型API市场份额达46.4%,位居第一,阿里云27%、百度17%分列二三。豆包凭借字节系产品矩阵优势快速铺开应用场景,成为国内调用量最大的大模型,引领「应用为王」新趋势。

7月

月之暗面Kimi K2万亿参数模型登顶全球开源榜

7月,月之暗面发布万亿参数规模的Kimi K2模型,在多项国际基准测试中登顶全球开源模型榜首。K2在数学推理、代码生成等核心能力上展现与GPT-4相当的水平。11月发布K2 Thinking深度思考版本,性能超越GPT-5和Claude 4.5。12月完成5亿美元C轮融资,现金储备达100亿人民币。

7月

2025世界人工智能大会在上海举办

7月26-29日,2025世界人工智能大会(WAIC 2025)在上海举办,展览面积超7万平方米,参展企业超800家,展品超3000件。腾讯发布混元3D世界模型1.0,商汤发布日日新V6.5,多家企业集中展示最新成果。大会聚焦大模型、具身智能等前沿领域,成为全球AI产业风向标。

8月

DeepSeek发布V3.1版本大模型

2025年8月21日,DeepSeek发布DeepSeek V3.1版本,采用MIT许可协议开源。该模型采用混合架构,支持思考和非思考两种模式,在SWE-bench和Terminal-bench等基准测试上,较此前的V3和R1模型提升超过40%。V3.1-Terminus于9月22日更新,V3.2-Exp于9月29日发布,采用DeepSeek Sparse Attention更高效的注意力机制。

9月

DeepSeek-R1论文登上《自然》封面

9月,DeepSeek-R1研究论文登上《自然》封面,首次披露训练成本仅29.4万美元,在国际学术界引起轰动。Nature发布评论指出,依靠独立研究人员进行同行评审,是应对AI行业炒作的一种方式,希望更多AI公司能够效仿DeepSeek。

10月

腾讯混元世界模型 1.1 版本发布并开源:单卡即可部署,秒级创造 3D 世界

10月,腾讯混元世界模型1.1版本上线并开源,在3D场景生成质量和交互能力方面实现进一步提升。混元世界模型 1.1 版本(WorldMirror)正式发布并开源,新增支持多视图及视频输入,单卡即可部署,秒级创造 3D 世界。作为一个统一(any-to-any)的前馈式(feedforward)3D 重建大模型,混元世界模型 1.1 解决了 1.0 版本仅支持文本或单图输入的局限,首次同时支持多模态先验注入和多任务统一输出的端到端 3D 重建。此外,混元世界模型 1.1 还支持额外的相机、深度等多模态先验输入,并基于统一架构实现点云、深度、相机、表面法线和新视角合成等多种 3D 几何预测。

11月

月之暗面发布Kimi K2 Thinking推理模型

2025年11月6日,月之暗面发布Kimi K2 Thinking推理模型,作为中国首个万亿参数基座模型和第一个开源的agentic model。Kimi K2 Thinking基于月之暗面的模型即Agent理念训练,号称原生掌握“边思考,边使用工具”的能力,可在无人类干预的情况下自主实现300轮工具调用和持续稳定的多轮思考能力。对此月之暗面方面表示,“这是我们在Test-Time Scaling(测试时扩展)领域的最新进展,通过同时扩展思考Token和工具调用的轮次,实现更强的Agent和推理性能”。

12月

字节跳动发布豆包大模型1.8

2025年12月18日,在火山引擎Force原动力大会上,字节跳动正式发布豆包大模型1.8(Doubao-Seed-1.8)。该模型面向多模态Agent场景进行了定向优化,工具调用能力、复杂指令遵循能力及OS Agent能力显著增强。豆包大模型日均tokens调用量已超过50万亿,自发布以来实现400亿倍的高速增长。在多项公开评测中,豆包1.8在视觉推理、通用视觉问答、空间理解及视频理解等任务中均获得最佳或接近最佳成绩,整体水平接近全球顶尖的通用模型。

10月

月之暗面完成5亿美元C轮融资,现金持有超100亿元

2025年12月,月之暗面宣布完成5亿美元C轮融资且大幅超募,当前现金持有量超过100亿元人民币。IDG领投1.5亿美元,阿里、腾讯、王慧文等老股东均超额认购,投后估值43亿美元(约合300亿人民币)。公司创始人杨植麟在内部信中表示,2025年是Kimi充满突破的一年,K2系列模型让Kimi从中国走向了世界,C端商业化指数增长,9-11月海外和国内付费用户数平均月增长超过170%。接下来公司最重要的目标是超越Anthropic等前沿公司成为世界领先的AGI公司。

12月

智谱&MiniMax递表港股:冲击全球大模型第一股

2025年12月,MiniMax与智谱相继通过港交所聆讯,同步冲击「全球大模型第一股」。两家企业走出差异化路径:MiniMax深耕C端多模态产品,海外收入占比超70%;智谱聚焦B端MaaS服务,本地化部署收入达84.8%。此次递表,不仅能为企业注入资本活水,更能为行业建立清晰的估值锚点,推动中国大模型行业从野蛮生长,迈入规范化、商业化的成熟阶段。

那么,如何系统的去学习大模型LLM?

作为一名深耕行业的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1124822.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

安全测试在云原生环境的挑战:演进、痛点与破局之道

云原生重塑安全边界云原生技术(容器化、微服务、服务网格、不可变基础设施、声明式API)的广泛应用,彻底颠覆了传统单体应用的架构模式与部署范式。这种变革在提升敏捷性、弹性与资源利用率的同时,将安全测试推入了前所未有的复杂战…

springboot+vue爬取番茄小说数据及可视化系统设计与实现_e0uy67ps

目录系统架构设计数据爬取模块数据处理流程可视化功能实现关键技术指标开发技术核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方…

AI大模型赋能国企数字化转型:从理论到实践(附学习资源)

国有企业数字化转型的特殊性与背景 在数字经济与实体经济深度融合的当下,国有企业的数字化转型意义重大且具有独特性。首先,国有企业肩负着积极响应落实党中央、国务院在数字化转型方面政策的责任,这是政治使命所在。其次,国资央…

前端最友好的后台平台?XinServer 深度体验

前端最友好的后台平台?XinServer 深度体验 兄弟们,不知道你们有没有过这种经历:产品经理或者老板拍着你的肩膀说,“小王啊,咱们这个新项目,下个月要上线,后台部分就交给你了!” 你一…

热门盲盒小程序从0到1全拆解

盲盒行业近年热度持续攀升,不少人想入局开发个性化小程序,但对技术流程、核心功能了解不足 📊 开发前常见误区:误以为只需简单搭建界面,忽略后端逻辑与合规性;对「一番赏」「无限赏」等玩法的技术实现认知模…

20260107_165056_GPT-5.2已上线!不用魔法,国内直接用,国内最强镜像站,

OpenAI十周年,那个地表最强的AI,又回来了!新一代GPT-5.2「全家桶」直接把谷歌Gemini 3 Pro踩在脚下,专业实力更是堪比人类专家。 OpenAI深夜炸场!GPT-5.2震撼发布,全球AI王座再次易主。 谷歌的领先优势&…

深入浅出:Java面试必看!sleep与wait方法的区别详解

文章目录 深入浅出:Java面试必看!sleep与wait方法的区别详解什么是线程?为什么需要暂停线程?sleep()方法详解sleep()的基本概念sleep()的使用场景示例代码:使用sleep()实现简单的定时任务 sleep()的注意事项 wait()方法…

springboot+vue的图书馆座位预约与智能管理系统的设计与实现_2v403ii1

目录摘要开发技术核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要 该系统基于SpringBoot和Vue框架设计&…

儿童骑行用品新国标 2026 年实施 这些安全要点家长必看

近日,国家市场监督管理总局、国家标准化管理委员会正式发布《儿童骑行及活动用品 通用安全要求》(GB46517-2025)📢,该标准将于 2025 年 10 月 5 日发布、2026 年 11 月 1 日正式实施。这一标准的出台,填补了…

亲测好用10个一键生成论文工具,本科生轻松搞定毕业论文!

亲测好用10个一键生成论文工具,本科生轻松搞定毕业论文! AI 工具如何改变论文写作的未来 在当今学术写作中,越来越多的本科生开始借助 AI 工具来提升效率。尤其是在论文写作过程中,AI 不仅能够帮助学生快速生成初稿,还…

英文文献在哪里找:高效查找英文文献的方法与途径

一、WisPaper:智能学术搜索激发科研灵感 科研创新的关键是了解前沿,找到突破口。但传统查文献方式往往效率低: Google Scholar 或 arXiv 搜索结果太多,难以筛选公众号推送滞后,容易错过最新研究文献阅读时间长&#…

springboot+vue的学生宿舍管理系统的设计与实现 可视化2c0svsyf

目录摘要开发技术核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要 基于SpringBoot和Vue的学生宿舍管理系统…

2026必备8个降AI率工具测评,本科生去AI痕迹指南

2026必备8个降AI率工具测评,本科生去AI痕迹指南 2026年降AI率工具测评:为何需要专业工具? 随着人工智能技术的快速发展,AIGC(人工智能生成内容)检测系统在学术领域的应用日益广泛。许多本科生在撰写论文、报…

英文文献检索:高效策略与技巧指南

一、WisPaper:智能学术搜索激发科研灵感 科研创新的关键是了解前沿,找到突破口。但传统查文献方式往往效率低: Google Scholar 或 arXiv 搜索结果太多,难以筛选公众号推送滞后,容易错过最新研究文献阅读时间长&#…

【STM32】SysTick操作系统延时函数的讲解,手撸带操作系统的延时函数

1. 流水灯模拟多线程 用一个流水灯小实验学习systick,模拟多线程1.1 main.c 先看main.c文件,main函数中实现两个灯进行不同的任务 #include "sys.h" #include "delay.h" #include "led.h" #include "tasks.h"in…

强烈安利8个AI论文网站,专科生毕业论文轻松搞定!

强烈安利8个AI论文网站,专科生毕业论文轻松搞定! 专科生论文写作的救星,AI工具如何帮你轻松应对 对于许多专科生来说,毕业论文不仅是学业生涯中的一次重要考验,也是一场与时间、知识和压力的较量。而如今,随…

iOS App的tcp、udp数据包抓取在实际开发中的使用方式

我开始用数据流抓包的方式看 iOS 网络行为,是在一次很典型的场景里。 接口返回完全正常,日志也没有异常,但功能在真机上偶发失效。 代理抓包工具里,HTTPS 请求干净得不像是有问题的样子。先明确一件事:iOS 数据流抓包在…

医院智能随访管理系统,java版随访系统源码,符合三甲医院评审标准,能对接HIS等医疗系统

医院智能随访管理系统包括患者档案管理、随访呵护、随访登记、健康教育等功能,支持主动随访模式和被动随访模式,为随访工作人员提供管理信息和标准化随访依据,能够很好地辅助医院各科室的日常随访工作、规范随访的信息处理流程,提…

STM32F103步进电机S曲线加减速定位算法详解

stm32f103步进S曲线加减速定位算法在嵌入式开发中,步进电机的控制是一个常见的需求,尤其是在需要精确定位的场合。今天我们来聊聊如何在STM32F103上实现步进电机的S曲线加减速定位算法。这个算法不仅能让我们更平滑地控制电机,还能减少机械冲…

机器学习中的层次聚类(凝聚型)

摘要:层次聚类(凝聚型)是一种自底向上的无监督聚类算法,通过逐步合并最近邻簇构建层次结构。该算法首先将每个样本视为独立簇,然后基于距离度量(如Ward法、单链接法等)迭代合并簇,最…