智谱新模型也用DeepSeek的MLA,苹果M5就能跑

这是一个30B总参数、仅3B激活参数的混合专家(MoE)架构模型,官方给它的定位是“本地编程与智能体助手”。

智谱AI上市后,再发新成果。

开源轻量级大语言模型GLM-4.7-Flash,直接替代前代GLM-4.5-Flash,API免费开放调用。

这是一个30B总参数、仅3B激活参数的混合专家(MoE)架构模型,官方给它的定位是“本地编程与智能体助手”。

在SWE-bench Verified代码修复测试中,GLM-4.7-Flash拿下59.2分,“人类最后的考试”等评测中也显著超越同规模的Qwen3-30B和GPT-OSS-20B。

作为去年12月发布的旗舰模型GLM-4.7的轻量化版本,GLM-4.7-Flash继承了GLM-4系列在编码和推理上的核心能力,同时针对效率做了专门优化。

除了编程,官方还推荐将这个模型用于创意写作、翻译、长上下文任务,甚至角色扮演场景。

30B参数只激活3B,MLA架构首次上线

GLM-4.7-Flash沿用了该系列的”混合思考模型”的设计。

总参数量300亿,但实际推理时仅激活约30亿参数,使模型在保持能力的同时大幅降低计算开销。

上下文窗口支持到200K,既可以云端API调用,也支持本地部署。

目前官方还没有给出技术报告,更多细节还要从配置文件自己挖掘。

有开发者注意到一个重要细节:GLM团队这次首次采用了MLA(Multi-head Latent Attention)架构。这一架构此前由DeepSeek-v2率先使用并验证有效,如今智谱也跟进了。

从具体结构来看,GLM-4.7-Flash的深度与GLM-4.5 Air和Qwen3-30B-A3B接近,但专家数量有所不同——它采用64个专家而非128个,激活时只调用5个(算上共享专家)。

目前发布不到12小时,HuggingFace、vLLM等主流平台就提供了day0支持。

官方也在第一时间提供了对华为昇腾NPU的支持。

本地部署方面,经开发者实测在32GB统一内存、M5芯片的苹果笔记本上能跑到43 token/s的速度。

官方API平台上基础版GLM-4.7-Flash完全免费(限1个并发),高速版GLM-4.7-FlashX价格也相当白菜。

对比同类模型,在上下文长度支持和输出token价格上有优势,但目前延迟和吞吐量还有待优化。

HuggingFace:https://huggingface.co/zai-org/GLM-4.7-Flash

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1191196.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Da】达芬奇基础设置

--本篇导航--工程项目基础设置偏好设置代理优化面板写在前面:达芬奇用的是官方的免费版Davinvi Resolve 20,很多Studio版的功能就没涉及到了。 基本剪辑、调色的部分,此笔记中都涉及到了。 学达芬奇仅仅是想做长视频…

XML外部实体注入(XXE)漏洞深度剖析与防御实践

【精选优质专栏推荐】 《AI 技术前沿》 —— 紧跟 AI 最新趋势与应用《网络安全新手快速入门(附漏洞挖掘案例)》 —— 零基础安全入门必看《BurpSuite 入门教程(附实战图文)》 —— 渗透测试必备工具详解《网安渗透工具使用教程(全)》 —— 一站式工具手册《CTF 新手入门实战教…

快讯|萝博派对(RoboParty)Roboto_Origin项目全栈上线:1.2m人形机器人硬件结构、BOM清单、3m/s运动控制算法完全开源;灵心巧手与Xbotics推出线上实习项目,打造人才生态

🐾 具身智能 / AI 赛道,过去24小时的行业焦点,像北京的冬日阳光一样,一半洒在突破想象力的AI疆界,另一半则直射向机器人领域那些试图“掀翻桌子”的年轻身影。当GPT-5.2 Pro在数学的圣殿里留下足迹时,一群0…

阿里云ECS部署hadoop+MapReduce+Spark实践

阿里云ECS部署hadoop+MapReduce+Spark实践host说明 Namenode:主机结点 Datanode1:数据节点1 Datanode2:数据节点2 私网ip(在阿里云查看) 172.xx.xxx.xx Namenode 172.xx.xx.xx Datanode1 172.xx.xxx.xxx D…

GBase 8s MTK工具,让数据库迁移更简单

在企业数字化转型和国产化替代的浪潮中,数据迁移往往是让IT团队最头疼的环节之一:源端系统五花八门,迁移过程怕丢数据、怕出错,操作复杂门槛高……而与GBase 8s数据库配套的GBase Migration Toolkit(简称 MTK&#xff…

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

谷歌最新研究表明,DeepSeek-R1这类顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的……AI变聪明的真相居然是正在“脑内群聊”?!谷歌最新研究表明,DeepSeek-R1这…

【课程设计/毕业设计】机器学习基于python-cnn深度学习识别水果是否成熟

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

GBase 8c数据库故障定位解析

南大通用GBase 8c数据库定位数据库故障,可从以下方面进行排查分析:日志:数据库日志记录了数据库服务端启动、运行或停止时出现的问题,当数据库在启动、运行或停止的过程中出现问题时,数据库用户可以通过运行日志快速分…

无需PLC控制,威纶通触摸屏直接实现与台达变频器通信控制

一、PLC通信简介 威纶通(Weinview)触摸屏作为工业人机交互核心,与台达(Delta)变频器的通信是自动化控制系统中常见的应用场景。通过两者的稳定通信,可实现变频器运行状态监控、参数设置、启停控制等功能,简化操…

巴菲特的市场周期理解

巴菲特的市场周期理解 关键词:巴菲特、市场周期、价值投资、市场波动、长期投资、风险评估、投资策略 摘要:本文深入探讨了巴菲特对市场周期的理解。从背景介绍入手,阐述研究目的、预期读者、文档结构及相关术语。接着剖析核心概念,揭示市场周期与巴菲特投资理念的联系,并…

探索健康管理虚拟仿真实训室的创新教学应用

一、推动教学理念从知识传授向能力建构转型 健康管理虚拟仿真实训室的应用,首先带来的是教学理念的深刻革新。传统教学往往偏重于理论知识与标准流程的讲授,学生缺乏在复杂、动态的真实情境中综合决策与应急处置的机会。点击获取方案 而健康管理虚拟仿真…

GBase 8c数据库操作系统故障定位介绍

南大通用GBase 8c数据库查询状态时,显示一个节点上所有实例都不正常时,可能是操作系统发生了故障。可以通过如下方法确定操作系统是否存在问题:1、通过 SSH 或者其它远程登录工具登录该节点。如果连接失败,请尝试通过 ping 发包检…

【Effective Modern C++】第二章 auto:6. 当auto推导的类型不符合要求时,使用显式类型初始化习惯用法

个人认为原著写的非常难懂,所以精简总结如下: auto与代理类的问题: 当使用auto进行类型推导时,如果表达式返回的是代理类,auto会推导出代理类型而不是被代理的实际类型,可能导致未定义行为。 例如&#…

智慧旅游虚拟仿真实训:场景化与交互式学习

随着旅游产业的数字化转型不断深入,行业对既掌握专业理论知识,又具备实践操作与应变能力的高素质人才需求日益迫切。在这一背景下,旅游管理虚拟仿真实训室应运而生,它作为连接传统课堂与真实行业场景的关键桥梁,正深刻…

【毕业设计】(源码+文档+远程调试,全bao定制等)基于python-cnn深度学习识别水果是否成熟

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

GBase 8c数据库磁盘故障定位解析

南大通用GBase 8c数据库常见的磁盘故障是磁盘空间不足、磁盘出现坏块、磁盘未挂载等。部分磁盘故障会导致文件系统损坏,例如磁盘未挂载,数据库管理自动定期执行磁盘检测时会识别故障并将实例停止,查看数据库状态时对应实例状态异常&#xff1…

5.AiServices工具类

目录 一.为什么要学习这个工具类? 二.使用步骤 1.引入依赖 2.声明接口 3.使用AiServices为接口创建代理对象 方式①:编写配置类 方式②:使用注解 4.在Controller中注入并使用 三.运行项目,测试效果 四.解释一下上面的Co…

莫凡电视的核心优势——聚焦全国地方台全量覆盖

各位影视与电视技术爱好者,今天分享莫凡电视的核心优势——聚焦全国地方台全量覆盖与直播流畅度,技术点扎实易懂,适配智能电视、机顶盒、投影仪等终端,大幅提升本地频道观影体验与实用性。 地方台接收核心搭载多协议解码引擎&…

谁需要迪士尼验厂与FAMA

需要知道谁做迪士尼验厂和谁需要FAMA,首先我们要来分清楚他们各自是什么? 迪士尼验厂(Disney ILS Audit)是迪士尼公司对其全球供应链中生产工厂进行的一种符合性审核,旨在确保供应商在社会责任、劳工权益、职业健康安全…