“DeepSeek 时刻” 一周年

这是一个系列文章中的第一篇。在这篇文章中,我们将回顾过去一年中国开源 AI 社区发生的历史性转折,并分析这些变化如何重塑整个全球开源生态系统。

许多 2025 年的重要进展,都可以追溯到一个起点:2025 年 1 月的 “DeepSeek 时刻”。当时,总部位于杭州的人工智能公司深度求索(DeepSeek)发布了其开源推理模型 DeepSeek R1,这一事件迅速成为中国乃至全球开源人工智能生态的重要分水岭。

在接下来的三篇文章中,我们将依次讨论:

第一篇(本文):战略层面的变化以及新开源模型和新参与者的井喷式增长

第二篇:在开放生态背景下,中国公司所做出的架构与硬件选择

第三篇:关键组织的长期轨迹,以及全球开源生态系统可能走向何方

对于依赖和贡献开源生态的 AI 研究者与工程师,以及试图理解这一在快速变化环境的政策制定者而言,过去一年所呈现的信号非常明确,即现在正是构建和发布开源模型与技术的最佳窗口期。值得注意的是,地缘政治因素在很大程度上推动了开源模型的采用;尽管整个 2025 年中,中国开发的模型在各项指标上持续占据主导地位,新进入者也不断实现跨越式发展,但西方 AI 社区正在积极寻找可用于商业部署的替代方案。

中国本土开源 AI 生态的起源

在 R1 发布之前,中国的人工智能产业在很大程度上仍以闭源模型为中心。开源模型虽然已经存在多年,但主要局限于研究社区,或仅在诸如隐私敏感应用等小众场景中使用。对大多数公司而言,开源并不是默认选择。算力资源相对紧张的情况下,“开源还是闭源”始终是一个被反复讨论的问题。

DeepSeek 的 R1 模型降低了获取先进模型能力的门槛,并提供了一种清晰、可供效仿的发展范式,从而解锁了新的发展层级。更重要的是,这次发布为中国 人工智能的发展带来了一样极其宝贵的东西:时间。即使在资源有限的情况下,依然可以通过开源与快速迭代实现快速进步。这一路径与中国在 2017 年提出的 “AI+” 战略目标契合:尽可能早地将人工智能与产业相结合,同时在长期持续推进算力能力的建设。

R1 发布一年后,我们看到的不仅是一批新模型,还有一个正在成长的原生开源生态系统。

DeepSeek R1:一个转折点

这是中国的开源模型首次进入全球主流榜单,并且在随后的一年中,每当有新模型发布时,它都反复被用作重要的参考基准。DeepSeek R1 很快成为 Hugging Face 有史以来获赞最多的模型,而获赞最高的模型中,也不再以美国开发的模型为主。

然而,R1 的真正意义并不在于它在当时是否是最强的模型,它的重要性在于:它是如何同时降低了三个关键门槛。

首先是技术门槛。R1 通过公开其推理路径和后训练方法,将此前被封装在闭源 API 背后的高级推理能力,转变为一种可下载、可蒸馏、可微调的工程资产。许多团队因此不再需要从零开始训练庞大的模型,也能够获得强大的推理能力。推理开始变得像一个可复用的模块,被反复应用于不同的系统之中。这一变化也促使整个行业重新思考模型能力与算力成本之间的关系,而这种转变在像中国这样算力受限的环境中尤为重要。

其次是应用门槛。R1 以 MIT 许可证发布,使其在使用、修改和再分发方面都变得非常直接。此前依赖闭源模型的公司开始将 R1 直接引入生产环境。蒸馏、二次训练以及面向特定领域的适配,逐渐演变为常规的工程工作,而不再是需要单独立项的特殊项目。随着分发限制的消失,模型迅速扩展到各类云平台和工具链之中,社区讨论的重心也从 “哪个模型得分更高”,转向 “如何部署、如何降低成本、以及如何将其集成到真实系统中”。随着时间推移,R1 超越了研究制品的范畴,成为一个可复用的工程基础设施。

最后是心理门槛。当问题从 “我们能不能做到?” 变成 “我们如何把这件事做好?”时,许多公司的决策逻辑随之发生了变化。对于中国人工智能社区而言,这同样是一个难得的、持续受到全球关注的时刻。对于一个长期被视为 “追随者” 的生态系统来说,这种关注具有深远意义。

这三个门槛的同步降低,共同意味着:整个生态系统开始具备自我复制和自我扩张的能力。

从 DeepSeek 到 AI+:战略重组

一旦开源成为主流,一个自然的问题随之而来:中国公司的战略将如何变化?在过去一年中,答案变得清晰:竞争开始从模型之间的比拼转向系统级能力的较量。

与 2024 年相比,R1 发布之后,中国的人工智能格局逐步形成了一种新的态势:大型科技公司率先行动,初创公司迅速跟进,来自垂直行业的公司也越来越多地进入这一领域。尽管各自路径不同,但一种共同的认知正在逐步形成,尤其是在头部玩家之间:开源已不再是短期战术,而是长期竞争战略的一部分。

中国公司在 Hugging Face 的模型仓库增长图

中国发布最先进模型和代码库的组织数量迅速增长。这一趋势清晰地反映在中国公司在 Hugging Face 的模型仓库增长图 中:既有巨头的开源发布数量大幅上升,其中百度在 2024 年于 Hugging Face 上尚无任何发布,而到 2025 年已超过 100 个;字节跳动、腾讯等公司也将其发布数量提升了 8 到 9 倍。与此同时,大量新近转向开源的组织涌入,发布了性能极高的模型,其中月之暗面的开源发布 Kimi K2 被称为“又一个 DeepSeek 时刻”。

Hugging Face 每周新创建模型统计

模型发布不仅变得更强,也变得更加频繁。高性能模型几乎以每周为节奏持续推出。新创建的中国模型在每一周中都稳定地成为获赞最多、下载量最高的模型,在 Hugging Face 下载量最高的新模型中始终保持着最高的人气。Hugging Face 的 每周新创建模型统计 图中展示了这些新模型仓库,并根据组织所在地或热门衍生模型所基于的底座模型组织所在地进行了标注。

中国开源热力图

正如 Hugging Face 中国开源热力图所显示,在 2025 年 2 月至 7 月 期间,中国公司发布开源项目的活跃度明显提升。其中百度和月之暗面开始从以闭源为主的路径,转向更系统性的开源发布。智谱的 GLM 以及阿里巴巴的通义千问 (Qwen) 更进一步,不再仅仅发布模型权重,而是扩展到构建完整的工程系统和生态接口。

在这一阶段,单纯比较模型的原始性能已不足以取得优势。竞争的焦点越来越集中在生态系统、应用场景以及基础设施之上。

这一战略已被事实证明是有效的:在所有新创建(发布时间不足一年)的模型中,中国模型的下载量已经超过包括美国在内的任何其他国家。

中国的人工智能玩家并不是通过协议进行协同,而是在约束之下实现趋同。表面上看似合作的行为,更准确地说,是在共同的技术、经济与监管压力下形成的对齐。这并不意味着这些公司结成了合作联盟;相反,在算力、成本和合规等相似约束条件下,它们开始沿着相近的技术基础和工程路径展开竞争。

当竞争发生在可比的系统结构之上时,生态系统便开始显现出自我传播与自我成长的能力。最近来自智谱 AI、月之暗面、阿里巴巴通义千问(Qwen)以及腾讯的技术领导者,就若干共性问题进行同台交流,这种现象在其他国家极为罕见。

全球的反响与应对

全球范围内,对开源应用和发展的积极情绪有所增强,尤其是在美国,人们越来越广泛地认识到:开源领导力对于提升全球竞争力至关重要。

DeepSeek 在全球市场获得了广泛采用,尤其是在东南亚和非洲地区。在这些市场中,多语言支持、开放权重的可用性以及成本因素,共同推动了企业级应用的落地。

西方组织在商业部署时,往往倾向于寻找非中国来源的模型。来自美国机构的重要发布。例如 OpenAI 的 gpt-oss、AI2 的 Olmo 以及 Meta 的 Llama 4,都获得了社区的广泛关注。Reflection AI 也宣布将致力于构建美国的前沿开放权重模型。在法国,Mistral 发布了 Mistral Large 3 系列,持续推进其开源根基。

但与此同时,西方的也有多项重要发布是建立在中国模型之上。2025 年 11 月,Deep Cogito 发布了 Cogito v2.1,被视为当时领先的美国开放权重模型,而该模型正是 DeepSeek-V3 的微调版本。在全球范围内,使用开放权重模型的初创公司和研究人员,往往将中国开发的模型作为默认选择,甚至在很大程度上依赖这些模型。

美国的 Truly Open Model(ATOM) 项目也明确将 DeepSeek 及中国模型所展现出的发展势头,视为推动其致力于在开放权重模型领域取得领先地位的重要动因。该项目强调需要多方力量共同投入,其相关研究同样指出了 OpenAI 的 gpt-oss 在早期阶段所获得的大规模采用。

世界仍在持续回应这一变化,一股新的开源热潮正在形成。2026 年有望迎来一系列重大发布,尤其是来自中国和美国的发布。而与之高度相关的,将是架构趋势、硬件选择以及组织发展方向——这些内容,将在本系列的下一篇文章中进一步展开。

本文所展示的所有数据均来源于 Hugging Face。如需了解更多与 2025 年开源相关的数据与分析,建议阅读以下内容:

- Data Provenance Initiative 与 Hugging Face 联合发布的《开放智能经济:追踪模型生态系统中的权力与参与》(Economies of Open Intelligence: Tracing Power & Participation in the Model Ecosystem)

https://www.dataprovenance.org/economies-of-open-intelligence.pdf

- aiWorld《2025 年开源 AI 年度回顾》

https://huggingface.co/spaces/aiworld-eu/Open-Source-AI-Year-in-Review-2025

- InterConnects 的《解释开放模型现状的 8 张图表》

https://www.interconnects.ai/p/8-plots-that-explain-the-state-of

英文原文: https://huggingface.co/blog/huggingface/one-year-since-the-deepseek-moment

原文作者: Adina Yakefu, Irene Solaiman

译者: Adina

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1199683.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Skills、Commands、Agents、Plugins——这些概念你分得清吗?

困惑 知识星球上,星友「隆中对」提问: 王老师,最近 AI 火爆,学习热情高涨,可能是有些用力过猛 ,自己突然有些概念搞不太清楚:-) —— Skills, Commands, Agents, Plugins. 这些名词全…

【大数据毕设源码分享】django基于协同过滤算法+数据可视化的经济型酒店推荐系统大数据的设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

向量数据库 vs 知识图谱:GraphRAG 的崛起

Knowledge graphs 和 vector databases 常被定位为彼此竞争的技术,但这种框架忽略了问题的本质。 它们是对立的吗?简短回答:不是。 它们解决的是根本不同的问题。事实上,它们最好的状态是协同,而不是对抗。如果你在构…

不用背理论!5 个新手设计技巧,快速提升作品质感

新手做设计,总怕自己没基础做不出好作品——要么版面乱成一团,要么配色丑到辣眼,要么重点根本不突出。其实不用学PS高级功能,不用背配色理论,抓住这5个能直接落地的技巧,几分钟就能做出有质感的作品。 技巧…

数组算法-双指针

首先,双指针法,本质是通过两个索引(指针) 在数组上移动,用一次遍历(O (n) 时间复杂度)替代嵌套循环(O (n)),核心是用空间换时间(仅额外使用两个变…

最新谷歌商店安装教程(保姆级),谷歌三件套问题汇总!闪退,无法登录等各手机解决方案

一定要看清楚,很多大佬最后失败就是没掌握方法。 重要提醒 这里给大家汇总谷歌三件套的版本合集,应该是目前最全面的谷歌三件套版本汇总了。 在安装的时候一定要试一下不同版本的谷歌服务框架! 在安装的时候一定要试一下不同版本的谷歌服务…

基于Python + Django物业管理系统(源码+数据库+文档)

物业管理 目录 基于PythonDjango物业管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于PythonDjango物业管理系统 一、前言 博主介绍:✌️大厂码农…

基于Python 个性化餐饮管理系统(源码+数据库+文档)

个性化餐饮管理 目录 基于PythonDjango个性化餐饮管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于PythonDjango个性化餐饮管理系统 一、前言 博主介绍&…

智慧交通数据治理中的典型“四重困境”:**异构性、时效性、关联性、质量性**四大瓶颈,共同导致数据价值难以释放

智慧交通数据治理中的典型“四重困境”:异构性、时效性、关联性、质量性四大瓶颈,共同导致数据价值难以释放。要系统性破局,需构建“一底座、两引擎、三闭环”的新型交通数据智能中枢架构: 一底座:建设统一时空基准的数…

驾校管理|基于springboot + vue驾校管理系统(源码+数据库+文档)

驾校管理 目录 基于springboot vue驾校管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue驾校管理系统 一、前言 博主介绍:✌️大…

要落实国家“人工智能+”行动与“数据要素×”三年行动计划并打造数智化发展新高地

要落实国家“人工智能”行动与“数据要素”三年行动计划并打造数智化发展新高地,可从以下方面入手: 在“人工智能”行动方面,首先,结合本地产业特色,推动人工智能与传统产业深度融合。例如在制造业领域,引入…

通过华为账号识别用户风险,降低业务损失

当应用平台组织诸如秒杀、抽奖等营销活动时,经常会遭遇"薅羊毛"行为,给业务方带来不小的经费损失。比如通过虚假手机号进行批量注册,多次参加活动;又比如,当应用商户进行红包补贴、优惠券发放等营销活动…

基于Python 图书管理系统(源码+数据库+文档)

图书管理 目录 基于PythonDjango图书管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于PythonDjango图书管理系统 一、前言 博主介绍:✌️大厂码农…

【大数据毕设全套源码+文档】基于Django+协同过滤算法的电影个性化推荐系统的设计与实现(丰富项目+远程调试+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

数据作为新型生产要素,正深刻推动各产业数字化转型与智能化升级

数据作为新型生产要素,正深刻推动各产业数字化转型与智能化升级。高质量数据集是实现数据价值释放的关键基础,能够有效支撑人工智能模型训练、算法优化和场景化应用落地。此次面向能源、生物医药、金融、交通、低空、教育等重点领域的首批高质量数据集“…

揭秘气相毛细柱行业十大品牌:生产厂家综合实力排行榜

在精密分析仪器领域,一根直径不足1毫米的毛细柱,却承载着环境监测的生命线、制药安全的守护神、食品安全的第一道防线。2026年,全球气相色谱柱市场正经历国产突围与国际巨头深度博弈的关键期,一份基于市场份额、技…

快速验证:用中文Cursor一小时打造天气APP

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个基于Python的天气查询应用原型,要求:1. 全程使用中文版Cursor 2. 展示AI生成代码过程 3. 包含API调用和UI设计 4. 可一键运行的完整项目。使用Flas…

2026成都装修公司哪家好?实测口碑装修公司+选装攻略,新手装修省心装

2026成都装修公司哪家好?实测口碑装修公司+选装攻略,新手装修省心装一、引言:成都装修市场选择多样,选对公司更省心 在成都这个充满活力与机遇的城市,装修市场正蓬勃发展。无论是旧房翻新,还是新房装修,人们对居…

RAG性能瓶颈突破:文档切分的核心逻辑与最优实践

引言在检索增强生成(RAG)系统中,有一个看似基础却能决定系统成败的关键环节——文档切分。很多开发者搭建的RAG系统,检索结果不准确、生成内容驴唇不对马嘴,究其原因,往往是文档切分做得不到位。想象一下&a…

【大数据毕设全套源码+文档】基于Djangod+协同过滤算法的经济型酒店推荐系统大数据的设计与实现(丰富项目+远程调试+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…