智谱×昇腾×昇思:自主创新算力赋能,多模态SOTA模型再迎新突破

在AI核心技术从“专用工具”向“通用智能伙伴”跨越的今天,全球算力升级正在支撑百万级Token的长上下文处理,并通过整合文本、图像、音频、视频及3D点云等多源数据,推动人机交互向“所见即所得”的多模态交互演进。

继谷歌发布Nano Banana Pro认知型生成模型之后,1月14日,智谱联合华为也正式发布了新一代图像生成模型GLM-Image。作为智谱面向「认知型生成」技术范式的一次重要探索,该模型采用自主创新的「自回归+扩散解码器」混合架构,实现了图像生成与语言模型的协同。

得益于昇腾NPU和昇思MindSpore AI框架所提供的从数据到训练的全流程支撑,GLM-Image不仅是首个基于自主创新算力底座全程训练的SOTA多模态模型,也是首个开源的工业表现级离散自回归图像生成模型。1月15日,GLM-Image更是登顶全球知名AI开源社区Hugging Face Trending榜。这也是中国首次实现基于自主创新算力底座的前沿多模态模型全流程训练与全球开源榜首突破。

可以说,GLM-Image的创新实践,既验证了在昇腾全栈算力底座上训练高性能多模态生成模型的可行性,也为社区挖掘自主创新算力潜力提供了重要参考。

拥抱架构创新,打造中国版开源Nano Banana

过去几年,文本生成图像(T2I)与多模态生成式模型的能力突飞猛进,尤其是Nano Banana Pro的问世,文本生成图像正在广泛应用于角色一致性、照片修复及无限画布局部编辑等场景,成为创意与技术深度融合的助推器。

作为全球首家以通用人工智能(AGI)基座大模型为核心业务的上市公司,智谱也在积极开展AI图像生成与编辑模型的创新。智谱全新推出的GLM-Image,在实际复杂图文任务中的表现让人眼前一亮。

比如,在科普插画中,GLM-Image可以绘制出包含复杂逻辑流程与文字说明的科普插画及原理示意图;在社交媒体图文封面中,GLM-Image可以制作社交媒体封面及内容等排版复杂的图片;在商业海报中,GLM-Image能够生成构图富有设计感、文字嵌入准确的节日海报与商业宣传图。

GLM-Image之所以能够让创作更自由丰富,首先得益于创新的「自回归+扩散解码器」混合架构,可兼顾全局指令理解与局部细节刻画,克服海报、PPT、科普图等知识密集型场景生成难题。同时,GLM-Image还能够自适应处理多种分辨率,帮助用户生成任意比例的图像。

在此基础上,GLM-Image在文字渲染的权威榜单中达到开源SOTA水平。其中,在CVTG-2K(复杂视觉文本生成)和LongText-Bench(长文本渲染)榜单均位列开源模型第一,可大大提升在图像中同时生成多处文字的准确性,以及渲染长文本、多行文字的准确性。

昇腾+昇思,全栈自主创新算力底座助力模型训练

除了采用创新的混合架构之外,GLM-Image还是首个基于自主创新算力底座全程训练的SOTA模型。模型的自回归结构基于昇腾Atlas 800T A2设备与昇思MindSpore AI框架,完成了从数据预处理到大规模训练的全流程构建,充分验证了在全栈自主创新算力底座上也能训练出SOTA模型。

其中,Atlas 800T A2作为昇腾训练服务器设备,具有高计算密度、高能效比、高网络带宽、易扩展、易管理等特点,可以更好地满足智谱在深度学习模型开发和AI训练服务场景上的需要。

而昇思MindSpore AI框架则内置大模型训练所需的多种并行能力,可提供简单易用的大模型分布式策略配置接口,帮助智谱快速实现高性能的大模型分布式训练。同时,该框架通过动静统一编程,可最大程度地发挥昇腾硬件能力,帮助智谱缩短训练时间,提升推理性能。

依托昇腾NPU与昇思MindSpore AI框架,智谱利用动态图多级流水下发、高性能融合算子、多流并行等特性,自研了一整套模型训练套件,对数据预处理、预训练、SFT(监督微调)和RL(强化学习)的端到端流程进行了全面优化。

其中,借助动态图的多级流水优化机制,将Host侧算子下发的关键阶段流水化并高度重叠,可提升训练性能20%;借助AdamW EMA、COC、RMS Norm等昇腾亲和的高性能融合算子,可提升训练的稳定性,并将通信效率提升15%;借助多流并行策略,将通信和计算相互掩盖,打破了文本梯度同步、图像特征广播等操作的通信墙,可整体提升训练性能10%。

自主创新算力引领,人工智能产业发展再迎新突破

当前,全球AI产业竞争日趋激烈,国外大模型技术的创新与迭代速度持续加快。在此背景下,智谱携手华为,在积极探索模型架构创新的同时,将自主创新算力充分应用到SOTA多模态模型训练中,不仅展现出中国企业在AI领域的创新实力,更凸显了自主创新算力底座所扮演的重要角色。

首先,验证了自主创新算力也能高性能训出SOTA模型。如今,模型训练对算力的计算精度、通信效率、软硬件协同优化的要求持续提升。智谱通过“昇腾+昇思”的应用实践,不仅打破了自主创新算力难以胜任尖端AI训练的刻板印象,也充分证明了自主创新算力完全有能力承载并驱动最前沿的AI研究与工程实践。

其次,为中国AI企业开展模型训练提供了极具价值的参考借鉴。智谱借助“昇腾+昇思”,从数据预处理、预训练到监督微调,再到强化学习,为中国企业、开源社区开展模型训练提供了端到端的全流程自主创新技术的落地范例,可帮助企业开发者降低自主创新算力底座的应用门槛,加速推进模型创新与落地进程。

再次,推动了全栈自主创新算力生态的繁荣发展。AI产业的创新发展,离不开算力底座、模型架构和应用落地三者的相互协同,智谱与昇腾、昇思的协同,不仅提升了模型训练的效率与安全性,也反向驱动了昇腾与昇思的能力提升,加速自主创新算力底座从“可用”到“好用”的进化,并为推进AI产业生态的繁荣奠定了坚实基础。

最后,加速了多模态AI技术自主创新与普惠化进程。多模态作为通往通用人工智能的关键一环,其能力直接关乎未来数字内容创作、智能交互等核心产业的创新发展。智谱借助昇腾、昇思成功训练出GLM-Image,意味着中国AI产业可以更加安全、高效地开展多模态AI的创新,从而推动多模态技术更快速、更广泛地应用到各行各业。

在多模态AI成为技术创新与产业应用核心方向的今天,智谱携手昇腾、昇思,其突破性远远不止于打造一个优秀的图像生成模型,更是一次自主创新算力底座支撑SOTA模型训练的关键验证。随着智谱与昇腾合作的持续深化,也将吸引更多企业加入自主创新的AI生态构建中,推动中国AI产业高质量发展。未来,中国AI产业完全有能力构建从算力底座到应用创新的全链路竞争力,并为全球AI产业的发展贡献中国智慧和中国方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1195996.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

安消一体化优秀企业与实力厂家全景解析:构建新时代的安全防线

一、行业趋势:安消融合的时代必然当城市的天际线不断刷新高度,当智慧建筑日益复杂,传统的安防与消防分离模式正面临严峻挑战。中国安全防范产品行业协会联合应急管理部消防救援局发布的《2024年度中国公共安全发展报…

导师严选2026 10款一键生成论文工具测评:本科生毕业论文必备神器

导师严选2026 10款一键生成论文工具测评:本科生毕业论文必备神器 学术写作工具测评:为何需要一份2026年权威榜单 随着人工智能技术的不断发展,越来越多的本科生开始借助AI工具辅助论文写作。然而,面对市场上琳琅满目的“一键生成…

2026卫生职称考试3个月分阶段高效备考攻略

前言:考生备考2026卫生职称考试常陷入考纲不明、术语难懂的迷茫,这份攻略以“低门槛入门、循序渐进夯实基础”为核心,搭配阿虎医考基础向资源,帮考生逐步搭建备考体系,稳步通关2026卫生职称考试。 一、攻略前置:…

TDI/MDI光化反应器哪家强?全球五大高端品牌深度对比

在聚氨酯工业的宏大版图中,TDI(甲苯二异氰酸酯)和MDI(二苯基甲烷二异氰酸酯)作为两大核心原料,其生产过程中的光气化反应器堪称整个工艺的"心脏"。这一关键设备的技术水平直接决定了产品的纯度、能耗、…

NTS-886003-ntp服务器

在信息技术高度发达的今天,精确、可靠、安全的时间同步已成为金融交易、电力调度、通信网络、数据中心及科学研究等领域基础设施稳定运行的基石。北京昕辰清虹科技有限公司推出的 NTS-H-886003 型高精度授时服务器,正是为满足此类高标准需求而设计的旗舰…

2026执业药师刷题app哪家好?这三款靠谱app强力推荐!

2026执业药师刷题app哪家好?这三款靠谱app强力推荐!一、 备考提效利器:为什么考生需要一款靠谱的刷题APP?执业药师考试内容广、考点多,单纯依赖“题海战术”效率低下,且难以精准突破薄弱环节。一款优秀的刷题APP…

即插即用系列 | CVPR 2025 MK-UNet: 多核深度可分离卷积,重新定义轻量级医学图像分割

论文题目:MK-UNet: Multi-kernel Lightweight CNN for Medical Image Segmentation 论文作者:Md Mostafijur Rahman, Radu Marculescu (The University of Texas at Austin) 论文原文 (Paper):https://arxiv.org/abs/2509.18493 官方代码 (Co…

AcWing 3714:砍树 ← 线性 DP(北京师范大学考研机试题)

​【题目来源】https://www.acwing.com/problem/content/3717/【题目描述】一共 n 棵树排成一排,初始时,相邻两个树的距离都相等。请你砍掉其中尽可能少的树,使得剩余树的高度构成非递减序列且相邻树木之间的距离都…

爆火技术Agent Skills深度解析:让Claude Code拥有专业技能,打造更美观UI,建议收藏!

文章介绍了Anthropic推出的Agent Skills技术,这是一种让AI助手掌握特定专业技能的方法。通过将技能要求存储在结构化的Markdown文件中,AI可在需要时动态加载这些技能,节省token并提高效率。文章以网站UI设计为例,展示了如何创建、…

刷题必备!2026五大热门执业药师刷题app实测对比,这份靠谱之选请收好!

刷题必备!2026五大热门执业药师刷题app实测对比,这份靠谱之选请收好!一、 开篇:在理性实测中锁定考生的最佳拍档面对众多执业药师刷题APP,宣传各异,让人难以抉择。与其盲从,不如进行一次多维度的理性实测。本文…

伊比利亚・智筑双轨 2026:西班牙展台设计搭建的创新范本

开篇:西班牙会展的三核变革与适配命题 2026 年的西班牙会展业,正由三大事件重塑行业格局:F1 赛事重返马德里,围绕 IFEMA 会展中心打造半城市赛道,催生 “体育 IP + 会展” 融合展示需求;巴塞罗那 ISE 欧洲集成系…

有关MGnify

这段话主要介绍了 MGnify 数据库 2024年4月版 中蛋白质数据的来源、处理方式和文件格式。 为了让你一看就懂,我把它拆解成直译和大白话解释两部分: 1. 直译(学术版) MGnify 蛋白质序列来自对公开宏基因组组装的分析…

导师严选8个AI论文工具,助你轻松搞定本科生论文!

导师严选8个AI论文工具,助你轻松搞定本科生论文! AI 工具如何改变论文写作的未来 在当今这个信息爆炸的时代,本科生面对的学术任务越来越繁重,尤其是在撰写论文的过程中,从选题、资料收集到内容撰写、格式调整&#xf…

2026真实测评对比!执业中药师备考资料口碑排行,这三个推荐最靠谱!

2026真实测评对比!执业中药师备考资料口碑排行,这三个推荐最靠谱!一、 起底:执业中药师备考市场的“资源迷宫”2026年执业中药师备考季来临,考生们首先面临的挑战便是如何穿越备考资料的“资源迷宫”。各类“速通…

2026卫生职称考试备考资源准确选择攻略

前言:考生备战2026卫生职称考试,核心痛点是“时间碎片化、没时间备考、备考了就忘”。这份攻略以“时间拆分+重点聚焦”为核心,搭配阿虎医考便携资源,帮考生利用间隙高效备考,平衡工作与2026卫生职称考试备考。 一…

深圳科心大看失眠怎么样

在深圳市,一家名为“ 深圳科心大失眠抑郁专科”的医疗机构以其专业性、正规的医疗服务以及精良的专家团队,赢得了市民的信赖和好评。创新开展“临床心理门诊+心理咨询中心”医学心理全体系诊疗模式,构建了集医学诊断…

完整教程:DBA 运维 数据库 备份 还原 MSSQL

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

618 大促技术实践:定时任务异常重试的探索与沉淀​

在 618 大促的技术战场上,每一行代码、每一个配置都影响着一线的实实在在的业务。一次看似平常的发版,却意外暴露了我们系统中的定时任务管理短板,这促使我们深入剖析分布式任务调度中异常重试机制的技术细节,并最…

2026执业中药师备考资料看什么?高分考生口碑推荐的五大资源盘点!

2026执业中药师备考资料看什么?高分考生口碑推荐的五大资源盘点!一、 开篇:向高分通过者取经,揭秘高效备考资料在执业中药师备考路上,最宝贵的经验往往来自那些已经成功通关的高分考生。他们的选择,经历了实战检…

专著参编证明怎么开?

专著参编证明怎么开?专著主编、副主编的参编证明模版是怎样的?下面淘淘学术来给大家讲解这个疑问。一、什么情况下需要提供参编证明在评职称的时候,如果出版了专著,那么一般会要求提供相关的证明材料。1如果是独著或者合著的专著&…