GLM-Image 上线 AtomGit,国产芯片训练的多模态开源模型开放使用

2026 年 1 月 4 日,智谱联合华为研发的多模态模型GLM-Image 正式上线 AtomGit 开源平台。该模型是首个基于国产芯片完成全流程训练的 SOTA 多模态产品,依托昇腾硬件与昇思框架构建,在文字生成、多场景适配等方面表现突出,为开发者提供了可靠的开源技术方案。

👉 模型仓库:https://ai.gitcode.com/zai-org/GLM-Image

👉 代码仓库:https://atomgit.com/zai-org/GLM-Image-code

模型核心特性:架构创新与国产化适配

🪧 GLM-Image 技术报告:https://z.ai/blog/glm-image

GLM-Image 的核心优势集中在技术架构与训练部署的双重突破。架构层面,采用“自回归 + 扩散解码器”混合设计,融合 9B 规模自回归模型与 7B 大小的 DiT 扩散解码器,前者负责指令理解与全局构图,后者搭配 Glyph Encoder 文本编码器,提升图像细节与文字生成的准确性,有效改善传统模型文字错漏问题。

训练部署方面,模型从数据预处理到大规模预训练,全流程基于昇腾 Atlas 800T A2 设备昇思 MindSpore AI 框架完成,验证了国产全栈算力底座支持前沿多模态模型训练的可行性。同时,通过改进 Tokenizer 策略,模型可自适应1024×10242048×2048尺寸的任意比例图像生成,无需额外训练,适配更多使用场景。

通用 pipeline

解码器结构示意图

权威榜单认证:文字生成能力达开源领先水平

在专业测评中,GLM-Image 的文字生成表现处于开源模型前列。CVTG-2K(复杂视觉文字生成)榜单中,其文字准确率达0.9116,归一化编辑距离为0.9557,生成文字与目标内容的一致性较高;LongText-Bench(长文本渲染)榜单覆盖 8 类文字密集场景,其中中文生成准确率0.979、英文0.952,在开源模型中排名第一,适用于海报、PPT、科普图等场景的文字呈现需求。

GLM-Image 实测案例参考

1|场景一:科普插画

GLM-Image 更擅长绘制包含复杂逻辑流程与文字说明的科普插画及原理示意图。

2|场景二:多格图画

在生成电商图、漫画等多格图画时,GLM-Image能够保持风格和主体的一致性,并保障多处文字生成的准确率。

3|场景三:社交媒体图文封面

GLM-Image 适用于制作社交媒体封面及内容等排版复杂的图片,让您的创作更自由丰富。

4|场景四:商业海报

GLM-Image 能够生成构图富有设计感、文字嵌入准确的节日海报与商业宣传图。

5|场景五:写实摄影

在文字渲染以外,GLM-Image也同样擅长生成各种景别和尺寸的人像、宠物、风景、静物。

AtomGit 平台获取与使用指南

👉 模型仓库:https://ai.gitcode.com/zai-org/GLM-Image

👉 代码仓库:https://atomgit.com/zai-org/GLM-Image-code

目前,GLM-Image 的完整开源资源已同步至 AtomGit,开发者可通过以下方式快速上手:

  1. 项目获取:进入 “GLM-Image”代码仓库,即可克隆源码、查看技术文档,文档包含架构解析、部署步骤等详细内容,助力快速搭建运行环境;

  2. 应用参考:平台收录科普插画、多格电商图、社交媒体封面、商业海报、写实摄影等 5 类实测案例,提供 Prompt 设计与参数配置参考,降低场景化应用门槛;

  3. 社区交流:开发者在讨论区可分享使用经验、反馈问题,与技术团队及同行共同优化模型效果。

此外,该模型 API 调用模式下生成单张图片仅需 0.1 元,后续将推出速度优化版本,兼顾成本与效率,适用于个人开发实践与企业级项目落地。

开源意义:推动国产 AI 生态协同发展

GLM-Image 的开源不仅分享了 “认知型生成” 技术路径,更为国产算力与 AI 模型的协同优化提供了实践参考。作为首个国产芯片全流程训练的 SOTA 多模态模型,其在 AtomGit 的上线,为开发者提供了低成本接入前沿技术的渠道,也为国产开源 AI 生态的完善注入新动力。

如需获取模型源码及相关资源,可访问 AtomGit 项目页面。欢迎开发者参与项目交流与二次开发,共同探索多模态生成技术的应用边界。

👉 立即访问 AtomGit 获取 GLM-Image:

  • 模型仓库:https://ai.gitcode.com/zai-org/GLM-Image

  • 代码仓库:https://atomgit.com/zai-org/GLM-Image-code

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1159791.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026论文降AI工具全评测:免费降AI率是捷径还是陷阱?这10款工具让你一次明白!

各位正在与论文交稿截止日期赛跑的同学们,进度如何了? 作为刚刚“上岸”的过来人,我实在太懂现在的你们正在经历什么。用AI辅助写论文固然畅快,可一旦迎来AIGC检测,那场面真是“灾难级”的——我自己就曾初稿被查重系…

飞算JavaAI智能会话模式,让编程像“开挂”一样简单

飞算JavaAI提供智能会话的能力,支持智能问答、Javachat、智能体三种模式,不仅可以为开发者解决开发过程中的问题,同时系统具备代码智能生成、多维度上下文关联、版本快照回溯等核心能力,覆盖需求分析、代码优化、缺陷修复等典型研…

拒绝冗余,介绍一款轻量简洁的知识管理工具 - sward

中国区Confluence Server即将停止销售,今天给大家推荐一款国产开源免费的开源平替方案 - sward。 1、产品简介 sward是一款国产的且免费开源的知识管理工具,包含知识库管理、目录管理、文档管理、markdown管理、文档的评审与版本维护等模块。产品页面简…

Kanass快速上手教程,从安装到入门

Kanass是一款国产开源免费、简洁易用的项目管理工具,包含项目管理、项目集管理、事项管理、工时管理、统计分析相关模块,工具功能完善,简洁易用,本文将介绍如何安装配置Kanass及快速入门上手。 1、安装 kanass支持多系统安装&am…

AI降重的技术本质:从困惑度到语义重构,一文读懂降AI率的底层逻辑

AI降重的技术本质:从困惑度到语义重构,一文读懂降AI率的底层逻辑 TL;DR: 降AI率的核心原理是调整文本的「困惑度」(Perplexity)和「突变性」(Burstiness)这两个关键指标。AI生成的内容困惑度低、突变性差,而人类写作恰恰相反。专业降AI工具通…

无损音乐收藏利器:Qobuz-dl 完全使用指南

无损音乐收藏利器:Qobuz-dl 完全使用指南 【免费下载链接】qobuz-dl A complete Lossless and Hi-Res music downloader for Qobuz 项目地址: https://gitcode.com/gh_mirrors/qo/qobuz-dl 在数字音乐成为主流的今天,你是否曾担心网络不稳定时无法…

论文AI率太高怎么办?这5款神器帮你秒降到5%

论文AI率太高怎么办?这5款神器帮你秒降到5% TL;DR 论文AI率太高是2026年毕业生的普遍痛点,大多数高校要求AI率低于15%。本文推荐5款亲测有效的降AI工具,其中嘎嘎降AI可将AI率从62.7%降至5.8%,比话降AI承诺知网AI率降至15%以下且…

论文AI率太高怎么办?3步搞定AIGC检测,小白也能学会

论文AI率太高怎么办?3步搞定AIGC检测,小白也能学会 TL;DR:论文AI率太高不是因为你用了AI,而是因为文字太「完美」。AIGC检测系统识别的是逻辑惯性和表达模式。本文分享3步降AI方法:识别问题段落→手动调整结构→用嘎嘎…

Linux日志管理与分析实战:从轮转到集中收集

前言 日志是排查问题的第一手资料。但日志管理不好,要么磁盘被占满,要么关键时刻找不到日志。Linux提供了logrotate、journald等工具管理日志,但在分布式环境下,还需要集中收集和分析。 这篇文章从单机日志管理到集中收集方案&…

论文AI率居高不下的五大真相:高校检测政策与算法升级全面解读

论文AI率居高不下的五大真相:高校检测政策与算法升级全面解读 TL;DR: 2025年各大高校纷纷出台AIGC检测政策,本科论文一般要求AI率≤30%,硕士≤15%,博士≤10%。论文AI率高的原因不只是「用了AI」,还包括参考模板被污染、…

比话降AI vs SpeedAI:2026年降AI工具实测对比,谁更稳?

比话降AI vs SpeedAI:2026年降AI工具实测对比,谁更稳? TL;DR 实测对比了嘎嘎降AI、比话降AI和SpeedAI三款主流降AI工具。结论是:追求极致性价比选SpeedAI(1.2元/千字),要求稳定达标选嘎嘎降AI…

孩子视力下滑不用慌?选对训练方法,近视可防可控

当发现孩子看东西频繁眯眼、歪头时,很多家长都会陷入焦虑,担心孩子一旦近视就难以逆转。事实上,近视并非不可控,关键在于选对科学的干预方式,尤其是在早期阶段,通过合理的训练方法就能有效延缓视力下滑&…

纪念币预约革命:告别手动抢购的终极自动化解决方案

纪念币预约革命:告别手动抢购的终极自动化解决方案 【免费下载链接】auto_commemorative_coin_booking 项目地址: https://gitcode.com/gh_mirrors/au/auto_commemorative_coin_booking 还在为每次纪念币预约时的紧张手速而焦虑吗?auto_commemor…

深度学习毕设项目推荐-基于python-CNN深度学习对马路道路是否破损识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

seekbar 进度条不够宽!

android:splitTrack"false" android:progressDrawable"drawable/custom_seekbar_style" android:thumb"drawable/custom_thumb" android:thumbOffset"15dp" android:layout_height"55dp"

【计算机毕业设计案例】基于python-CNN人工智能深度学习对马路道路是否破损识别基于python-CNN深度学习对马路道路是否破损识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

跨编程语言的轻量级HTTP客户端库unirest

Unirest是一个跨编程语言的轻量级HTTP客户端库,最初由Mashape(即现在的Kong Inc.)开发维护。它旨在用最简洁直观的API简化HTTP请求的发送过程,支持多种常见编程语言,让开发者能够以相似的风格在不同项目中发起HTTP请求…

跨编程语言的轻量级HTTP客户端库unirest

Unirest是一个跨编程语言的轻量级HTTP客户端库,最初由Mashape(即现在的Kong Inc.)开发维护。它旨在用最简洁直观的API简化HTTP请求的发送过程,支持多种常见编程语言,让开发者能够以相似的风格在不同项目中发起HTTP请求…

用豆包写论文被检测出AI?试试这4款降AI神器

用豆包写论文被检测出AI?试试这4款降AI神器 TL;DR:豆包写的论文AI率高达80%-90%很正常,因为它本身就是AI生成的内容。想降下来有两条路:用豆包自己改写(效果有限)或者用专业降AI工具(效果更好&a…

用豆包写论文被检测出AI?试试这4款降AI神器

用豆包写论文被检测出AI?试试这4款降AI神器 TL;DR:豆包写的论文AI率高达80%-90%很正常,因为它本身就是AI生成的内容。想降下来有两条路:用豆包自己改写(效果有限)或者用专业降AI工具(效果更好&a…