【开源上新】4B 参数突破端侧智能体性能壁垒!AgentCPM-Explore 正式入驻 AtomGit

当行业还在讨论 “大参数模型如何降本” 时,一款仅 4B 参数的端侧智能体模型,已用实力重新定义小模型的性能天花板 —— 由清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合研发的AgentCPM-Explore,今日正式在 AtomGit 开源!作为聚焦 “开源 + AI” 的一体化协作平台,AtomGit 将为开发者提供模型托管、代码协作、算力协同全链路支持,让这款 “以小博大” 的端侧智能体技术触手可及。

👉 代码仓库:https://atomgit.com/OpenBMB/AgentCPM

👉 模型仓库:https://ai.atomgit.com/OpenBMB/AgentCPM-Explore

为什么 AgentCPM-Explore 值得关注?

4 大核心突破颠覆认知

不同于传统小模型 “能力受限” 的刻板印象,AgentCPM-Explore 以 4B 参数实现了 “参数轻量化、能力高密度” 的突破,在 8 大主流智能体评测基准(GAIA、Browsercomp、HLE 等)中交出亮眼答卷:

  • 参数效能比拉满:不仅斩获同尺寸(4B)模型 SOTA,更越级超越 2 倍参数量(8B)的 SOTA 模型,部分任务性能比肩 30B 级模型与闭源大模型(如 Xbench-DeepResearch 任务达 70%,超越 Claude-4.5-sonnet 的 66%);

8 个智能体评测任务榜单

  • 长程探索稳如老狗:支持超 100 轮不重复且稳定的环境交互,面对多步骤复杂任务能持续深度探索,直至准确完成;

  • 类人思考更智能:拒绝 “死记硬背”,面对难题时会 “质疑错误信息”“主动找原始数据”“灵活切换搜索策略”,例如解答 “美国历届总统出生地最远间距” 时,能自主核查全量数据、调整工具调用逻辑;

  • 复杂任务 hold 住:在 GAIA 文本任务中,经后训练后可解决95%以上题目,证明小模型在正确训练框架下,完全能突破 “能力天花板”。

原模型 Qwen3-4B-thinking-2507 与经过后训练的 AgentCPM-Explore 能力边界一览

全流程开源基建:从代码到评测,AtomGit 上一键打通

AgentCPM-Explore 不仅开源模型本身,更同步开放了 “从基础模型到 SOTA 效果” 的全流程技术栈 —— 三大核心工具平台已同步入驻 AtomGit 代码仓库,开发者无需从零搭建,直接复用即可实现性能翻倍:

1|AgentDock:工具沙盒统一调度平台

  • 高并发支持:原生接入 16 个 MCP 服务、百余种工具,核心工具可达 100+QPS 调用能力,适配 AtomGit 算力协同机制;

  • 容错拉满:自动重试、服务自愈、备用工具切换,确保长程任务不中断;

  • 轻量化接入:客户端仅需关注 “能力接口”,复杂网络、并发细节由平台搞定,支持工具热插拔。

2|AgentRL:极简异步强化学习框架

  • 零门槛上手:仅需标准 ChatCompletions 接口即可接入,核心代码仅 7 个文件、1000 + 行,新手也能快速验证想法;

  • 硬件榨干:支持 “采样 + 训练” 同 GPU 全异步运行,兼容 PyTorch 并行与 128K + 长文本训练,适配 AtomGit 算力资源调度;

  • 灵活扩展:训采完全解耦,采样进程可独立扩容,满足不同规模训练需求。

3|AgentToLeaP:智能体能力一键评测平台

  • 自动化评测:支持 GAIA、HLE 等 8 大榜单一键启动,一行命令完成全流程测试;

  • 自定义扩展:评测集独立管理,开发者可在 AtomGit 上快速接入私有测试集,验证模型适配性。

即刻上手:在 AtomGit 获取 AgentCPM-Explore

无论是想复现 SOTA 效果,还是基于此开发端侧智能体应用,在 AtomGit 上只需 2 步即可开启:

1|第一步:获取全流程代码

点击下方链接直达 AtomGit 代码仓库,获取模型训练、工具调用、评测全流程代码:

🔗 AgentCPM 代码仓库:https://ai.atomgit.com/OpenBMB/AgentCPM-Explore

(支持 Git 克隆、ZIP 下载,结合 AtomGit DevOps 工具链可直接开启开发)

2|第二步:获取模型权重与文档

进入 AtomGit 模型仓库,直接下载 AgentCPM-Explore 模型权重,或查看技术文档了解部署细节:

🔗 AgentCPM-Explore 模型仓库:https://ai.atomgit.com/OpenBMB/AgentCPM-Explore

(兼容 Hugging Face、ModelScope 生态,可直接用于端侧推理或二次训练)

共建端侧智能体新生态:AtomGit 与你同行

AgentCPM-Explore 的开源,是 “小模型释放大能量” 的起点,而 AtomGit 将为这份创新提供全周期支撑:

  • 对研究者:提供无代码训练平台、在线开发环境(Space),支持快速验证新算法、复现实验;

  • 对工程师:接入 AtomGit 算力协同能力,新注册用户每月可免费领取30M Tokens(API 推理)1000 核时 NPU 算力(模型训练),降低部署成本;

  • 对评测玩家:可在 AtomGit 社区分享测试样例,推动模型能力边界拓展。

正如 AtomGit“开源协作、赋能创新” 的理念,我们期待与所有开发者一起,让端侧智能体技术从 “实验室” 走向 “真实场景”—— 无论是手机端自动化任务、车载智能交互,还是工业端轻量化决策,AgentCPM-Explore 的开源都将成为新起点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1155942.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026年你应该掌握的进阶版 Gemini CLI 实用指南

现在用AI,只会在网页版当聊天机器人用吗?那你就out了。 Gemini CLI 是 Google 推出的终端 AI 助手。相比于网页版,命令行工具在处理本地文件、读取项目上下文方面有着天然优势。对于开发者而言,它不仅仅是一个聊天机器人&#xf…

电商api实战解析:1688.item_get_company 获取公司档案信息

一、接口定位item_get_company 不是“商品级”接口,而是“供应商级”接口。 输入:1688 商品 offerId 或 companyId(二选一) 输出:公司档案 60 字段,包括工商信息、深度认证、工厂能力、贸易能力、在线表现 …

【毕业设计】基于python_CNN深度学习卷积神经网络训练识别猫的表情

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

03.信号源讲解(三)---VEXP、IEXP篇 I PSpice高级应用

在电路仿真中,我们常需要模拟那些不按“开关”节奏变化,而是随时间逐渐建立或衰减的信号——比如电容的充电过程、电机的启动电流,或是传感器的热响应。PSpice中的VEXP(电压指数源)和IEXP(电流指数源&#…

职场人必备效率工具:2026年四款主流AI生成PPT工具实测报告

AI生成PPT不是一个新鲜事情了,记得这股风潮刚刚吹起来的时候,还有许多免费可以体验的产品或者是加个很便宜的,但是到今年几乎没有了,且都在疯狂的涨价。本期文章就为大家盘点4大免费好用(或者有试用机会)的…

深度学习毕设项目推荐-基于python_CNN深度学习卷积神经网络对猫狗识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

深度学习毕设项目推荐-基于python-AI深度学习对狗表情训练识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

多维分析与机器学习模型在金融诈骗检测中的应用案例研究(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)

多维分析与机器学习模型在金融诈骗检测中的应用案例研究 》 包含文档代码数据集 截图为文档原图 数据十万条 代码jupyter notebook格式

计算互相关积分电平的函数

function [IL_linear, IL_dB] myIL (x, y, plotEnable) %% 计算积分电平 % 2026.1.11 2A438 % 自己动手编写的波形的互相关的IL积分旁瓣电平、PIL积分电平 % 输入: % x: 输入信号1 % y: 输入信号2 % mlb: 主瓣宽度&…

【毕业设计】基于python_CNN深度学习卷积神经网络识别菠萝是否腐烂

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

ppo 找出口模型 训练 笔记 26/1/13

cnn模型大小我给他控制在训练耗时30s左右(4060ti) 动作空间6个:4个移动2个转头,因为一开始都要跑一遍,动作太多需要跑更多步才能吃到正反馈 我现在设置是60步一episode,5 episode训练一次 转头70度左右&…

【基于机器学习的租房信息分析系统】Python+mysql+Django,(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)

【基于机器学习的租房信息分析系统】PythonmysqlDjango,(设计源文件万字报告讲解)(支持资料、图片参考_相关定制) 项目核心功能: 1.登陆登出功能, 2.首页总览分析, 3.房源管理, 4.价格预测&…

教你如何认识数控车床代码、坐标、结构编程、加工工艺

学习识图:学会识别数控车床图纸表达方式,认识图纸标注形式,基本标注、公差标注、形位公差标注、表面粗糙度标注。学习坐标:根据图纸标注、书写出编程所需坐标,加强对图纸的认识。学习辅助代码:M00、M01、M0…

基于python机器学习的电商商品分析与预测(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)

基于python机器学习的电商商品分析与预测 (python,jupyter notebook 数据分析,多种机器学习,数据可视化 电子资料)本研究以9935条电商超市订单为样本

【毕业设计】基于python_CNN卷积神经网络深度学习识别花卉是否绽放

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

【计算机毕业设计案例】基于python_CNN卷积神经网络对猫狗识别基于python_CNN深度学习卷积神经网络对猫狗识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

国产力量崛起:2026十大本土HR软件厂商深度盘点

在信息技术应用创新和供应链安全的国家战略指引下,中国人力资源软件市场正经历一场深刻的国产化替代浪潮。曾经由SAP、Oracle等国际巨头主导的HR系统市场,如今已涌现出一批技术领先、服务扎实的国产优秀厂商。这些本土企业不仅深谙中国企业管理特色&…

【课程设计/毕业设计】基于python_CNN深度学习卷积神经网络对猫狗识别基于深度学习卷积神经网络对猫狗识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

基于决策树算法的感冒预测(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)

基于决策树算法的感冒预测(设计源文件万字报告讲解)(支持资料、图片参考_相关定制) 来源于公开数据集(梅奥),有完整的数据处理、特征筛选、方法介绍、决策树模型构建流程,测试集AUROC值达94.79%。

多肽定制合成丨Melgain 一种十肽Decapeptide

Melgain是一种外用多肽,主要用于治疗白癜风,这是一种以皮肤色素脱失斑块为特征的病症。了解Melgain的作用机制需要深入研究其活性成分、作用方式以及对皮肤细胞的总体影响。 Melgain中的活性成分是十肽,是一种由十个氨基酸组成的特定肽序列。…