完整教程:AI 术语通俗词典:Diffusion Models(扩散模型)

news/2025/9/27 14:38:17/文章来源:https://www.cnblogs.com/ljbguanli/p/19115098

完整教程:AI 术语通俗词典:Diffusion Models(扩散模型)

扩散模型(Diffusion Models)是近年来生成式人工智能(Generative AI)最重要的突破之一。它广泛应用于图像生成、语音合成、3D 建模等领域,也是 Stable Diffusion、Imagen 等著名文生图模型的核心技术。

理解当代 AIGC(AI Generated Content)技术的关键一步。就是理解扩散模型,

一、术语定义

一种基于概率生成的模型。就是Diffusion Models(扩散模型)

其核心思想是:

1、正向扩散(Forward Process):逐步向数据中添加噪声,使其趋近纯噪声。

2、反向扩散(Reverse Process):模型学习如何一步步去掉噪声,直到生成一张与训练分布一致、与原图相似的图像。

通过最终,模型能够从随机噪声中逐步生成与真实分布相似的新内容(如图片),而不仅仅是对已有数据的修改。

示意图由 DALL-E 生成

与人类类比:

可以把扩散模型理解成一个“逆向拼图大师”:

普通拼图:从完整拼图逐步拆开,终于剩下一堆碎片。

扩散模型:训练计算机从“碎片堆”(噪声)一步步拼回一幅全新的拼图。

二、提出背景

在扩散模型之前,生成模型主要有两大路线:

1、GAN(生成对抗网络)

优点:效果好、速度快于扩散模型。

缺点:训练不稳定,模式崩塌(mode collapse)严重。

2、VAE(变分自编码器)

优点:数学理论完整,收敛稳定。

缺点:生成图像往往模糊。由于重构目标偏向平均化,导致细节损失。

扩散模型提出后,兼具稳定训练与高保真生成的优势,逐渐成为主流。

三、工作原理

扩散模型的工作流程可以概括为三步:

1、正向扩散(Forward Diffusion)

给一张清晰的图片,逐步加噪:

第 1 步:加一点噪声

第 10 步:轮廓模糊

第 100 步:几乎全是噪声

2、反向扩散(Reverse Diffusion)

模型学习如何一步步去掉噪声,直到生成一张与原始数据分布相似的图像。

3、生成阶段(Generation)

给模型一张“纯噪声”,它会学会如何一步步还原,最终生成一张“全新”的图像。

这种过程,就像一位画家:先面对一张布满杂乱笔迹的画布,然后一层层擦除、修正,最终画出一幅全新作品。

四、典型模型

1、DDPM(Denoising Diffusion Probabilistic Models, 2020)

扩散模型的开创性论文,提出完整的概率建模框架。

2、DDIM(Denoising Diffusion Implicit Models, 2020)

改进采样方法,加快生成速度。

3、Latent Diffusion(潜在扩散模型,2022)

代表作:Stable Diffusion。

不直接在像素空间扩散,而是在“潜在空间”中操作,大幅降低计算量,让个人电脑也能跑生成。

五、应用场景

1、图像生成

文生图(Text-to-Image):Stable Diffusion、DALL·E、MidJourney。

图生图(Image-to-Image):修复老照片、风格迁移、图像上色。

2、语音与音频

扩散模型能生成接近人类自然声音的高质量语音,并被用于音乐合成与音频修复。

3、视频与 3D

Video Diffusion Models:生成短视频。

3D Diffusion Models:建模游戏场景或虚拟现实。

小结

一种基于噪声学习的生成模型。就是本质:扩散模型

优势:训练稳定,生成高保真细节。

代表:DDPM、DDIM、Stable Diffusion。

应用:图像生成、语音合成、视频生成、3D 建模。

扩散模型让 AI 真正具备了“从无到有创造”的能力,是推动 AIGC 浪潮的核心引擎。

图片

鼓励”就是“点赞有美意,赞赏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/919591.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pip安装依赖包报错内容为User defined options,Native files 如何解决

Visual Studio 生成工具可以帮助用户在 Windows 系统上编译和运行 C++ 程序等,以下是其安装教程:下载安装程序:打开浏览器,访问Visual Studio Build Tools 下载页面,找到 “下载” 按钮,点击下载 Build Tools fo…

上海网页制作模板云南seo刷关键词排名优化

安装好XenServer之后,可以找一台管理机器(目前主流系统都支持)安装XenCenter,通过XenCenter来实现对XenServer的管理。安装XenCenter: 安装.NET Framework3.5 然后可以下载安装中文版的XenCenter,下载地址&#xff1…

edu 107 E(概率期望, dp)

edu 107 E 一道很具有启发意义的概率期望题,需要从期望的本质来思考。 题目要求计算所有 \(2^{w}\) 种涂色方式可放多米诺骨牌的最大数量总和。按照常规想法思考是很困难的,需要换个角度:考虑每个可放置骨牌的 \(1\…

网站弹窗特效如何网上赚点零花钱

Spring有很多不同的模块。 所有这些对于具体目的都是有用的。 今天,我将讨论Spring Security。 该模块提供了灵活的方法来管理访问Web应用程序不同部分的许可。 在这篇文章中,我将研究Spring MVC , Hibernate , MySQL与Spring Sec…

做网站协议怎么签wordpress 视频

目前,不少企业都使用虚拟化/超融合运行 Kubernetes 和容器化应用。一些用户可能会有疑惑:既然 Kubernetes 可以部署在裸金属上,使用虚拟化不是“多此一举”吗? 在电子书《IT 基础架构团队的 Kubernetes 管理:从入门到…

2025 年空气离合器生产厂家推荐榜:电网冲击缓解技术与可靠性测评,单片空气离合器,多片空气离合器,空气离合器摩擦片,空气离合器密封件公司推荐

在矿山、冶金、水泥等重型工业领域,气动离合器作为磨矿机等大型设备的核心传动部件,其性能直接关系到生产稳定性与成本控制。当前行业正面临多重技术瓶颈:大功率电动机启动时产生的巨大电流常对电网造成强烈冲击,导…

Spring MVC的双向数据绑定

Spring MVC 是一个建立在Servlet API之上的模块化框架,它使用了Model-View-Controller(MVC)架构模式,并提供了一种分离关注点的方法来开发Web应用程序。在Spring MVC中,双向数据绑定是一个核心特性,它允许开发者…

抽象化编程(Abstraction in Programming)

抽象化编程(Abstraction in Programming)是面向对象编程(OOP)中一个非常重要的设计原则,它与我们前面讨论的封装、继承、多态紧密相关。抽象化编程的含义 核心思想: 关注于做什么(What),而不是如何做(How)。…

详细介绍:198种组合算法+优化BiLSTM神经网络+SHAP分析+新数据预测+多输出!深度学习可解释分析,强烈安利,粉丝必备!

详细介绍:198种组合算法+优化BiLSTM神经网络+SHAP分析+新数据预测+多输出!深度学习可解释分析,强烈安利,粉丝必备!2025-09-27 14:31 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; …

太原网站排名外包广州市工程交易中心官网

在面对日益增长的网络安全威胁时,DNS高防和IP高防作为防御策略发挥着重要的作用。虽然两者都旨在保护网络资源免受攻击,但它们在操作方式和防护重点上有着本质的不同。 DNS高防:保护域名解析服务DNS高防,全称是高防御的域名解析服…

网站关键词排名下降做网站 360的好不好

一、KeyStore描述 在 Android 开发中,KeyStore 是一个用于存储密钥和证书的安全容器。它提供了一种安全的方式来存储敏感信息,如密钥对、数字证书等,以防止它们被未授权的应用或攻击者访问。 KeyStore 通常用于加密数据、数字签名、TLS/SSL…

章丘网站优化美工培训班费用一般多少

这个是把<>过滤掉了所以只能用js的事件 ?weya"onfocus"alert(1337)" autofocus"

网站厨师短期培训班做网站实训心得

简单工厂模式、工厂模式和抽象工厂模式都是创建型设计模式&#xff0c;它们之间在目的、实现方式和适用场景上存在显著的区别。以下是对这三种模式的详细比较&#xff1a; 一、定义与目的 简单工厂模式&#xff08;Simple Factory Pattern&#xff09; 定义&#xff1a; 简单工…

STM32定时器(寄存器与HAL库实现) - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

微前端中iframe集成方式与应用微前端框架方式对比

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

配置RedisTemplate序列化机制

在Spring Boot应用程序中配置 RedisTemplate以实现特定序列化机制时,关键是要确保数据在保存到Redis时将Java对象转换成合适的格式,同时在读取时能够正确地将数据转换回Java对象。RedisTemplate提供了灵活的方式来自…

优化器(Optimizer)

优化器(Optimizer)是深度学习和机器学习中最核心的组件之一。 简单来说,优化器的作用就是指导模型如何学习。它决定了在反向传播计算出梯度(模型应该朝哪个方向调整)之后,模型应该以多大的“步伐”和什么样的方式…

为第三方网站做推广合肥seo排名扣费

打开题目 点击1到5号的结果 1号 2号 3号 4号 5号 这里直接令传入的id6 传入id1^1^1 逻辑符号|会被检测到&#xff0c;而&感觉成了注释符&#xff0c;&之后的内容都被替换掉了。 传入id1|1 直接盲注比较慢&#xff0c;还需要利用二分法来编写脚本 这里利用到大佬的脚…

阿里虚拟主机怎么做两个网站公司宣传折页模板

为了实现Windows主机与Linux服务器之间的资源共享&#xff0c;Linux操作系统提供了Samba服务&#xff0c;Samba服务为两种不同的操作系统架起了一座桥梁&#xff0c;使Linux系统和Windows系统之间能够实现互相通信&#xff0c;为广泛的Linux爱好者提供了极大方便。本文简要介绍…

2025 年气动离合器品牌推荐排行榜发布,聚焦博得 PLC 控制技术与降本优势,常开式气动离合器,多片式气动离合器,气动离合器电磁阀,气动离合器气缸,单片式气动离合器工厂推荐

在矿山、冶金、水泥等重型工业领域,气动离合器作为关键传动设备,直接影响着磨矿机等大型机械的运行稳定性与成本控制。当前行业普遍面临三大痛点:大功率电动机启动时的巨大电流易冲击电网,导致电力系统波动;“大马…