全栈突围:智谱GLM-Image × 昇腾·昇思携手走出“无人区”

技术只有变得足够“便宜”,才能实现真正“普及”,从而深度融入到工作与生活的方方面面。

所以,当GLM-Image在API调用模式下生成一张图片只需0.1元时,价格仅为海外同类产品的1/10至1/3,全球AI市场都为之震撼。

GLM-Image是智谱联合华为开源新一代图像生成模型,也是首个在国产芯片上完成全程训练的SOTA多模态模型,其基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成了从数据到训练的全流程。

GLM-Image模型强大的性能表现,及背后的全栈国产化训练历程,给出了一个极具参考价值的答案 :在AI高端领域,中国公司已走出无人区,实现全栈技术突围,对于后续整个AI产业具有里程碑的意义。

GLM-Image,新架构带来变革

在AI生图领域,主要存在扩散模型(Diffusion)和自回归模型(Autoregressive,AR)两种模型,两者各有优势却也存在短板。扩散模型难以理解复杂指令,在海报、PPT、科普插图等知识密集型场景中,往往会“语义脱节”的短板,会出现物理逻辑错误等问题;自回归模型则在生成图像质量难以令人满意。

为此,智谱GLM-Image创新性采用了自回归 + 扩散编码器混合架构。自回归模型犹如“大脑”,擅长处理序列逻辑和宏观语义,负责逻辑推理与框架构建;扩散解码器则专注于图像的高频细节还原,确保最终生成的图像在视觉上达到工业级的美学标准。GLM-Image的混合架构恰似“理解”意图之后再进行生图创作,这是向探索以 Nano Banana Pro为代表的新一代“知识+推理”的认知型生成模型迈出重要一步。

混合架构的优势,使得智谱GLM-Image尤其擅长文字渲染,在海报、插画等场景展现出强大的能力。来看看智谱GLM-Image的真实效果:

据悉,GLM-Image在CVTG-2K(复杂视觉文本生成)和LongText-Bench(长文本渲染)榜单获得开源第一。

此外,GLM-Image在开源不到24小时就登顶全球知名AI开源社区Hugging Face Trending榜第一。Hugging Face是全球知名的开源AI模型与工具生态平台,堪称全球AI界的顶流。GLM-Image此次登顶,其模型SOTA性能、混合架构创新和训练过程引发了全球AI圈的广泛热议。

昇腾·昇思助力全栈突围

再好的架构与算法,如果没有强大算力底座的支撑,也无法训练出强大的模型。

众所周知,像SOTA模型这种级别的前沿模型,对于AI算力集群的性能、稳定性与通信带宽有着极高要求,并且普遍需要国外AI芯片支撑此类训练任务。不过,智谱GLM-Image模型进行了开创性尝试,从海量数据预处理到大规模预训练,再到最后微调全流程使用国产算力,使得其成为首个基于自主创新算力底座全程训练的SOTA模型,也实现国产模型+国产算力+国产AI框架的全栈突围。

具体来看,GLM-Image属于多模态模型,需要处理大量文字和图片数据,在模型训练阶段的内存开销和性能要求极高。为此,昇腾·昇思引入动态图多级流水下发、多流并行执行、高性能融合算子等特性,全面提升从数据处理、预训练、SFT到RL的端到端性能。

例如,动态图多级流水下发,彻底解决了Host侧算子下发瓶颈问题。在NPU+CPU的集群中,大规模多核CPU会涉及到单线程算子下发跟不上NPU计算速度,导致设备侧空转与整体资源利用率偏低。依托昇腾+昇思MindSpore的软硬件协同,通过动态图多级流水下发,将Python执行、算子shape推导与算子下发等关键阶段进行流水化并高度重叠,有效提升Host侧算子下效率。

又如,GLM-Image的多模态训练场景中,文本梯度同步、图像特征广播、混合并行等操作都有复杂的通信需求。单流串行执行时,计算和通信两类操作互相等待,整体资源利用率低。为此,通过多流并行执行机制,让计算与通信两类操作同时并行,打破通信墙和大幅提升资源利用率,整体提升训练性能10%。

再如,昇腾CANN高性能算子库提供包括AdamW EMA融合算子、COC通算融合算子等,针对性解决训练后期loss震荡、通信开销大等问题,为GLM-Image模型的训练带来高性能和稳定性。

无疑,基于昇腾·昇思构建的国产算力底座在此次GLM-Image模型训练中经受住充分考验,充分证明了从国产芯片、AI框架到多模态模型的全栈突围并非遥不可及。

走出“无人区”具有里程碑意义

智谱与华为的此次深度合作,其意义远超一个模型的简单发布。

长期以来,中国AI开发者高度依赖国外AI硬件、AI框架等。事实证明,这种方式受制于人且充满高度不确定性,严重束缚中国AI的创新与发展。而智谱GLM-Image模型的问世,验证了在国产全栈算力底座上训练高性能复杂多模态模型的可行性,这标志着国产AI正式走出“无人区”、实现全栈突围,对于未来市场有着不可低估的影响:

其一、打破依赖惯性,给予国内AI开发者们重要信心。智谱GLM-Image模型的出色表现具有里程碑的意义,证明国产大模型+国产AI芯片+国产AI框架的组合SOTA级模型领域同样能打,后续其示范价值有望在AI开发者中得到持续影响。

其二、智谱GLM-Image模型开源,有望进一步激发AI生图领域的创新。众所周知,开源模式是降低创新门槛的和激发技术创新活力最为有效方式,而智谱GLM-Image开源,已经受到Hugging Face等知名平台的密切关注,未来有望吸纳更多开发者了解和加入到智谱GLM-Image项目之中,从而激发AI生图领域的迭代与创新。

其三、加速商业化落地和AI新生态形成。近年来,海外频繁传出中国大模型获得全球用户青睐的消息,根本原因在于中国大模型产品技术具备相当竞争力的同时,带来极具性价比的使用体验。像智谱GLM-Image在API调用模式将生成一张图片做到只需0.1元,这无疑对整个AI生图市场带来巨大冲击力,有望进一步推动AI生图相关技术与产品的普惠和AI生态的形成。

综合观察

勇气是不确定性时代唯一的通行证。

当市场充满不确定性时,在人工智能的“无人区”里,本就没有现成的路。智谱与华为的紧密合作,无疑走出一条独立、安全且具有国际竞争力之路,不仅诞生出GLM-Image这样出身的SOTA模型,更证明了国产AI全栈突围并非遥不可及。

展望未来,随着智谱在人工智能智能领域的持续探索,以及昇腾、昇思产品竞争力稳步提升,国产 AI 穿越“无人区”之后,迎接他们的将是AGI的星辰大海。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1191642.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机毕业设计springboot博物馆参观预约管理系统 基于SpringBoot的博物馆线上预约与票务综合平台 SpringBoot+MySQL构建的智慧展馆分时预约系统

计算机毕业设计springboot博物馆参观预约管理系统gkb2s(配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。疫情之后,“限量、预约、错峰”成为公共文化场所的新常态。传统…

Node.js 20+ 用Intl.ListFormat优化列表格式

💓 博客主页:瑕疵的CSDN主页 📝 Gitee主页:瑕疵的gitee主页 ⏩ 文章专栏:《热点资讯》 Node.js 20 中的 Intl.ListFormat:让列表格式化告别硬编码目录Node.js 20 中的 Intl.ListFormat:让列表格…

iOS App 电耗管理 通过系统电池记录、Xcode Instruments 与克魔(KeyMob)组合使用

在实际项目里,这个版本有点费电往往是一个很模糊的反馈。 测试同事觉得发热,产品感觉续航下降,但真正落到工程层面,经常卡在一个点上:耗电行为发生在什么场景、由谁触发、持续了多久。 电耗管理不是单一工具能解决的事…

从零开始写算法——回溯篇3:括号生成 + 单词搜索

回溯算法(DFS)是算法面试中的重难点。很多同学觉得它难,是因为分不清什么时候该“恢复现场”,什么时候该“标记状态”。今天我们通过两道经典的 LeetCode 题目——括号生成和单词搜索,来对比分析回溯算法的两种不同模式…

2026年Q1值得关注的电动伸缩门生产厂家有哪些?

文章摘要 随着智能化浪潮席卷安防与出入口管理领域,电动伸缩门行业正迎来新一轮技术升级与市场洗牌。本文旨在为有采购需求的企事业单位提供一份客观的参考,综合考量品牌实力、技术特点、服务网络及市场口碑等多维度…

计算机毕业设计springboot新冠物资管理 SpringBoot疫情物资调配与追踪系统 SpringBoot突发公卫物资智慧管理平台

计算机毕业设计springboot新冠物资管理f2h4e (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。2020 年以来,突发公共卫生事件让口罩、防护服、检测试剂等物资成为一线“…

2026年阜阳沙发供货厂家综合评估:甄选3家实力厂商,赋能企业高效采购

文章摘要 随着消费者对家居品质与供应链效率要求的不断提升,选择一家可靠的沙发供货厂家成为酒店、公寓、房企及经销商降本增效的关键。本文基于供应链实力、产品工艺、定制能力、项目交付及服务保障五大核心维度,对…

【开题答辩过程】以《基于springboot的影迷推影社交平台》为例,不知道这个选题怎么做的,不知道这个选题怎么开题答辩的可以进来看看

个人简介慕婉学姐精通Java、PHP、微信小程序、Python、Golang和安卓开发等语言,擅长开发大数据、深度学习、网站、小程序、安卓应用和算法项目。平时从事项目定制开发、代码讲解、答辩教学和文档编写,也掌握一些降重技巧。感谢大家的持续关注&#xff01…

【快速EI检索 | EI稳定检索 | 征稿范围广 | Springer-Advances in Science, Tec】2026年人工智能与数字服务国际学术会议(ICADS 2026)

第二届人文地理与城乡规划国际学术会议(HGURP 2026) 2026 2nd International Conference on Human Geography and Urban-Rural Planning 2026年2月6日(周五)|线上召开 大会官网:www.hgurp.org 截稿时间…

自动化毕设 stm32的火灾监控与可视化系统(源码+硬件+论文)

文章目录 0 前言1 主要功能2 硬件设计(原理图)3 核心软件设计4 实现效果5 最后 0 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉…

【034】AQS 高频深度面试题(附接地气详解)- 必背 - 详解

【034】AQS 高频深度面试题(附接地气详解)- 必背 - 详解2026-01-21 01:36 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important…

LangChain多智能体系统详解:5种架构模式与实战案例实现

本文详细介绍了LangChain中的多智能体系统(MAS),包括其定义、五种实现模式及其核心特性。通过构建搜索智能体的实际案例,展示了基于LangGraph的工作流和基于LangChain的双智能体架构两种实现方式。多智能体系统通过群体智能突破单…

从线程池到全局限流:并发失控的根因分析

一、问题不是“并发太大”,而是“没人对并发负责” 很多采集系统的并发失控,并不是因为工程师不知道要“控制并发”,而是因为并发从来没有被当成一种“平台级资源”来设计。 在早期阶段,我们构建采集任务时的并发逻辑往往很简单&a…

【快速EI检索 | 海外高校主办丨EI稳定检索 | 征稿范围广 】2026年生成式人工智能与教育国际学术会议(GAIE 2026)

2026年生成式人工智能与教育国际学术会议(GAIE 2026) 2026 International Conference on Generative Artificial Intelligence and Education (GAIE 2026) 2026年2月6日-2月8日 |新加坡 大会官网:www.icgaie.com 截稿时间:见官网&#xf…

网易企业邮箱珠海服务商:这5个关键优势你必须知道!

网易企业邮箱珠海服务商:这5个关键优势你必须知道!在珠海这座充满活力的创新之城,企业数字化通信的稳定与安全是业务高效运转的基石。选择一家可靠的企业邮箱服务商,对于保障商务沟通、提升品牌形象至关重要。作为网易企业邮箱在珠…

【快速EI检索 | 高录用 | EI检索稳定 | 对学生友好会议 | JPCS出版有ISSN号,高录用,见刊快】2026年航空航天、智能感知与控制国际学术会议

2026年航空航天、智能感知与控制国际学术会议 2026 International Conference on Aerospace, Intelligent Perception and Control (AIPC 2026) 2026年2月6日-2月8日 |中国-昆明 大会官网:www.icaipc.org 截稿时间:见官网(早投…

大厂Java岗面试复盘实录!

上个月班上的好好的突然被通知"毕业了",现在工作也确实不好找。之前近一个月面了很多大大小小的公司降薪太严重都没考虑去,最后没办法本来都打算随便去一家了却偶然得到一个阿里的面试机会,足足面了七面(我太难了&#…

SpringBoot+Vue 宠物领养系统管理平台源码【适合毕设/课设/学习】Java+MySQL

摘要 随着社会经济的快速发展和人们生活水平的不断提高,宠物已成为许多家庭的重要成员。然而,流浪动物问题日益突出,传统线下领养方式存在信息不对称、流程繁琐等问题。为解决这一问题,基于互联网的宠物领养平台应运而生&#xff…

打破协议壁垒:疆鸿智能DEVICENET与EtherCAT在新能源产线中的毫秒级协同

打破协议壁垒:疆鸿智能DEVICENET与EtherCAT在新能源产线中的毫秒级协同一、网关在工业互联中的作用 在工业自动化系统中,网关承担着协议转换、数据交互与网络集成的核心职能。尤其在多品牌设备共存的场景下,网关通过协议兼容与数据映射&…

吃透这 5 个 C/C++ 就业方向,应届生也能拿高薪 Offer

如果你现在正为 C 开发方向感到迷茫,不知道该往哪走,那这篇内容或许能给你一些思路。 相信我,几年后再回头看,你一定会感激此刻为方向努力探索的自己。 C 作为当下依然主流的面向对象语言,应用场景非常广泛 —— 总有…