论文阅读笔记:Generative Modeling by Estimating Gradients of the Data Distribution

1、参考来源

论文《Generative Modeling by Estimating Gradients of the Data Distribution》
来源:NeurIPS 2019
论文链接:https://arxiv.org/abs/1907.05600
参考链接:
【AI知识分享】真正搞懂扩散模型Score Matching一定要理解的三大核心问题

2、布朗运动

布朗运动是描述花粉微粒在水中的运动情况的。可以看出,花粉微粒在水中的受力情况如下所示。因此根据牛顿第二定律,
F = m a m ⋅ d v t d t = F 合力 = F 摩擦力 + F 碰撞力 = − γ ⋅ v t + η \begin{equation} \begin{split} F&=ma\\ m\cdot\frac{dv_t}{dt}&= F_{合力}\\ &=F_{摩擦力}+F_{碰撞力}\\ &=-\gamma\cdot v_t+\eta \end{split} \end{equation} Fmdtdvt=ma=F合力=F摩擦力+F碰撞力=γvt+η
其中, γ \gamma γ是摩擦力因子。 η \eta η是碰撞力,也是一个随机的力,满足高斯分布, η ∼ N ( 0 , σ 2 ) \eta \sim N(0,\sigma^2) ηN(0,σ2)
请添加图片描述

花粉微粒包含的总能量 E ω E_{\omega} Eω包含动能 E E E和势能 U U U。在合力的作用下,动能和势能相互转化,且总能量保持不变。动能定理,可以得到
F 合力 ⋅ Δ x = Δ E ⇕ F 合力 = Δ E Δ x = Δ E ω − Δ U Δ x = − Δ U Δ x \begin{equation} \begin{split} F_{合力}\cdot \Delta x&=\Delta E\\ &\Updownarrow\\ F_{合力}&=\frac{\Delta E}{\Delta x}\\ &=\frac{\Delta E_{\omega}-\Delta U}{\Delta x}\\ &=\frac{-\Delta U}{\Delta x} \end{split} \end{equation} F合力ΔxF合力=ΔE=ΔxΔE=ΔxΔEωΔU=ΔxΔU

其中, x x x为位移。由于花粉微粒的总能力 E ω E_{\omega} Eω保持不变,因此 Δ E ω Δ x = 0 \frac{\Delta E_{\omega}}{\Delta x}=0 ΔxΔEω=0
另一方面,花粉微粒在水中的分布,服从波尔兹曼分布。
P ( x ) = e − U ( x ) z \begin{equation} \begin{split} P(x)=\frac{e^{-U(x)}}{z} \end{split} \end{equation} P(x)=zeU(x)
其中 U ( x ) U(x) U(x)表示在位置 x x x处的花粉微粒所具有的势能。 z z z 是一个归一化因子。也就是说,具有势能越大的花粉,其对应的概率密度越小。波尔兹曼分布是描述粒子的热运动的。玻尔兹曼分布体现了系统的稳定性倾向。系统中的粒子总是趋向于占据能量较低的状态,因为低能量状态更稳定。但由于热运动的存在,粒子也有一定的概率处于较高能量的状态,不过这种概率会随着能量的升高而迅速减小。探秘玻尔兹曼分布:解锁微观粒子能量分布的神奇密码

对公式(3)的两边分别取对数且求导
∇ x l o g ( P ( x ) ) = ∇ x l o g e − U ( x ) z = ∇ x − U ( x ) = F 合力 = − γ ⋅ v t + η = − γ ⋅ d x d t + η ⇕ d x = − d t γ ∇ x l o g ( P ( x ) ) + η γ ⋅ d t ⇕ x t + Δ t = x t − Δ t γ ∇ x l o g ( P ( x ) ) + Δ t γ ⋅ η = x t − Δ t γ ∇ x l o g ( P ( x ) ) + Δ t γ ⋅ σ ⋅ z \begin{equation} \begin{split} \nabla_x log\big(P(x)\big)&=\nabla_x log \frac{e^{-U(x)}}{z} \\ &=\nabla_x-U(x) \\ &=F_{合力} \\ &=-\gamma\cdot v_t+\eta\\ &=-\gamma\cdot \frac{dx}{dt}+\eta \\ &\Updownarrow \\ dx&=-\frac{dt}{\gamma}\nabla_x log\big(P(x)\big) + \frac{\eta}{\gamma} \cdot dt \\ &\Updownarrow \\ x_{t+\Delta t}&=x_{t}-\frac{\Delta t}{\gamma}\nabla_x log\big(P(x)\big) + \frac{\Delta t}{\gamma} \cdot \eta\\ &=x_{t}-\frac{\Delta t}{\gamma}\nabla_x log\big(P(x)\big) + \frac{\Delta t}{\gamma} \cdot \sigma \cdot z\\ \end{split} \end{equation} xlog(P(x))dxxt+Δt=xlogzeU(x)=xU(x)=F合力=γvt+η=γdtdx+η=γdtxlog(P(x))+γηdt=xtγΔtxlog(P(x))+γΔtη=xtγΔtxlog(P(x))+γΔtσz
其中, z ∼ N ( 0 , 1 ) z\sim N(0,1) zN(0,1)。如果分别令 Δ t γ = ϵ 2 \frac{\Delta t}{\gamma}=\frac{\epsilon}{2} γΔt=2ϵ Δ t γ ⋅ σ = ϵ \frac{\Delta t}{\gamma} \cdot \sigma=\sqrt{\epsilon} γΔtσ=ϵ 。公式(4)则变为
x t + Δ t = x t − ϵ 2 ∇ x l o g ( P ( x ) ) + ϵ ⋅ z \begin{equation} \begin{split} x_{t+\Delta t}=x_{t}-\frac{\epsilon}{2}\nabla_x log\big(P(x)\big) + \sqrt{\epsilon} \cdot z\\ \end{split} \end{equation} xt+Δt=xt2ϵxlog(P(x))+ϵ z
对于下图中的概率分布来说,对于在 x 0 x_0 x0处的花粉微粒来说,其对应的斜率是负数,对应于公式(4)中的 ∇ x l o g ( P ( x ) ) \nabla_x log\big(P(x)\big) xlog(P(x))是负数。因此,相对于 x t x_{t} xt x t + Δ t x_{t+\Delta t} xt+Δt大概率会增大,因为是存在一个随机高斯分布 η \eta η;对于在 x 1 x_1 x1处的花粉微粒来说,其对应的斜率是正数,对应于公式(4)中的 ∇ x l o g ( P ( x ) ) \nabla_x log\big(P(x)\big) xlog(P(x))是正数。因此,相对于 x t x_{t} xt x t + Δ t x_{t+\Delta t} xt+Δt大概率会减小。综上所述,花粉微粒大概率会朝向密度低的位置移动。这是符合墨水滴入水中的运动常识的。
请添加图片描述
论文《Generative Modeling by Estimating Gradients of the Data Distribution》中的公式如公式(6)所示。可以看出,论文中的公式(6)是花粉扩散过程的逆过程
x t + Δ t = x t + ϵ 2 ∇ x l o g ( P ( x ) ) + ϵ ⋅ z \begin{equation} \begin{split} x_{t+\Delta t}=x_{t}+\frac{\epsilon}{2}\nabla_x log\big(P(x)\big) + \sqrt{\epsilon} \cdot z\\ \end{split} \end{equation} xt+Δt=xt+2ϵxlog(P(x))+ϵ z

2、正篇

图像生成别只知道扩散模型(Diffusion Models),还有基于梯度去噪的分数模型:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/77532.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Kubernetes相关的名词解释CNI插件(1)

(一)什么是CNI插件? 在 Kubernetes 中,CNI 插件(Container Network Interface Plugin) 是一种用于配置容器网络接口的标准工具,负责为 Pod 分配网络资源(如 IP 地址)并建…

2021-11-10 C++蜗牛爬井进3退1求天数

缘由C大一编程题目。-编程语言-CSDN问答 int n 0, t 0;cin >> n;while ((n - 3)>0)n, t;cout << t << endl;

分享一个DeepSeek+自建知识库实现人工智能,智能回答高级用法。

这个是我自己搞的DeepSeek大模型自建知识库相结合到一起实现了更强大的回答问题能力还有智能资源推荐等功能。如果感兴趣的小伙伴可以联系进行聊聊&#xff0c;这个成品已经有了实现了&#xff0c;所以可以融入到你的项目&#xff0c;或者毕设什么的还可以去参加比赛等等。 1.项…

动态规划算法:状态压缩

状态压缩动态规划算法 状态压缩动态规划是动态规划的一种&#xff0c;它通过使用位运算的方式压缩程序占用的空间&#xff0c;对于可以用来解决一些只有两个状态&#xff08;是与否&#xff09;的问题。 多少无益&#xff0c;我们通过下面的一道编程题目来学习这种算法。 题目…

查看matlab函数帮助文档的方法

方法一&#xff1a;在命令行窗口中使用help命令 方法二&#xff1a;在命令行窗口中使用doc命令 方法三&#xff1a;在帮助文档中搜索关键字

MYSQL初阶(暂为自用草稿)

目录 基本操作 database操作 table操作 数据类型 INT类型 bit类型 FLOAT类型 CHAR类型 DATE类型 SEL类型 表的约束 列约束 NULL DEFAULT PRIMARY KEY UNIQUE KEY 表约束 PRIMARY KEY FOREIGN KEY 其他补充 AUTO_INCREMENT COMMENT ZEROFILL 表的CRUD …

MVC/MVVM 高级应用的深度解析

状态共享与同步 跨组件状态管理策略 状态变更的传播机制优化 状态快照与时间旅行调试 状态持久化 本地存储策略 状态序列化与反序列化 与服务端状态同步 数据绑定进阶 双向绑定优化 脏检查机制优化 基于Proxy/Object.defineProperty的实现差异 批量更新策略 自定义…

AI 边缘计算盒子:开启智能物联新时代

一、什么是 AI 边缘计算盒子 AI 边缘计算盒子是一种集成了高性能芯片、AI 算法和数据处理能力的硬件设备。它部署在数据源的边缘侧&#xff0c;如工厂、商场、交通路口等&#xff0c;能够在本地进行数据采集、预处理、分析和决策&#xff0c;而无需将所有数据上传到云端。这种…

LeetCode 5:最长回文子串

1、题目描述 给你一个字符串 s&#xff0c;找到 s 中最长的 回文 子串。 示例 1: 输入&#xff1a;s "babad" 输出&#xff1a;"bab" 解释&#xff1a;"aba" 同样是符合题意的答案。 示例 2: 输入&#xff1a;s "cbbd" 输出&#…

简易 Python 爬虫实现,10min可完成带效果源码

目录 准备工作 编写爬虫代码 运行爬虫 查看结果 遇到的问题及解决 总结 前言和效果 本文记录了使用 Python 实现一个简单网页爬虫的过程&#xff0c;目标是爬取 quotes.toscrape.com 的名言和作者&#xff0c;并将结果保存到文本文件。以下是完整步骤&#xff0c;包含环境…

【KWDB 创作者计划】_上位机知识篇---Docker容器

文章目录 前言1. Docker 容器是什么&#xff1f;隔离性轻量级可移植性可复用性 2. Docker 核心概念镜像容器仓库Dockerfile 3. Docker 基本使用(1) 安装 Docker(2) 容器生命周期管理(3) 镜像管理(4) 进入容器内部(5) 数据持久化&#xff08;挂载卷&#xff09;(6) 网络管理 4. …

树莓派练习

1.守护进程 守护进程含义&#xff1a;守护进程在树莓派上电后开始运行&#xff0c;断电后结束运行的进程&#xff0c;即使你的终端退出也不会停止&#xff0c;我们可以手动关闭它 使用nohup创建守护进程 先创建一个c语言文件&#xff08;long_task.c&#xff09; #include …

详细解释浏览器是如何渲染页面的?

渲染流程概述 渲染的目标&#xff1a;将HTML文本转化为可以看到的像素点 当浏览器的网络线程收到 HTML 文档后&#xff0c;会产生一个渲染任务&#xff0c;并将其传递给渲染主线程的消息队列。在事件循环机制的作用下&#xff0c;渲染主线程取出消息队列中的渲染任务&#xff0…

java+postgresql+swagger-多表关联insert操作(九)

入参为json&#xff0c;然后根据需要对多张表进行操作&#xff1a; 入参格式&#xff1a; {"username": "车主01","usertel": "11111111111","useridtype": "2","useridcard": null,"proname&qu…

JavaSpring 中使用 Redis

创建项目 配置 Redis 服务地址 创建 Controller 类 由于当前只是些简单的测试代码&#xff0c;所以就不进行分层了&#xff0c;只创建一个 Controller 来实现 jedis 通过 jedis 对象里的各种方法来操作 Redis 此处通过 StringRedisTemplate 来操作 Redis 最原始提供的类是 Re…

AI文生图工具推荐

一、AI文生图技术实现原理 AI文生图&#xff08;Text-to-Image&#xff09;基于生成对抗网络&#xff08;GAN&#xff09;或扩散模型&#xff08;Diffusion Model&#xff09;实现&#xff0c;通过深度学习将文本描述转化为图像。其核心流程包括&#xff1a; 文本编码&#xf…

数据结构——快排和归并排序(非递归)

快速排序和归并排序一般都是用递归来实现的&#xff0c;但是掌握非递归也是很重要的&#xff0c;说不定在面试的时候面试官突然问你快排或者归并非递归实现&#xff0c;递归有时候并不好&#xff0c;在数据量非常大的时候效率就不好&#xff0c;但是使用非递归结果就不一样了&a…

【笔记】网络安全管理

计算机硬件中,运算器和控制器通常集成在一块芯片内,一般称为()。 数据库DB、数据库系统DBS、数据库管理系统DBMS,三者之间的关系是()。 OSI/RM体系结构中的网络层与TCP/IP体系结构中的()功能相同。 三级系统应按照等保2.0要求采用密码技术通信过程中数据的()。 …

.net core web api 数据验证(DataAnnotations)

目录 一、什么是 DataAnnotations&#xff1f; 二、扩展验证逻辑&#xff08;自定义验证器&#xff09; 一、什么是 DataAnnotations&#xff1f; DataAnnotations 是一组特性&#xff08;Attributes&#xff09;&#xff0c;用于在模型类上定义验证规则。主要用于属性级别的…

小白从0学习网站搭建的关键事项和避坑指南

以下是针对小白从零学习网站搭建时需要注意的关键事项和避坑指南&#xff0c;帮助你高效学习、少走弯路&#xff1a; 一、学习路径注意事项 不要跳过基础 误区&#xff1a;直接学习框架&#xff08;如 React、Laravel&#xff09;而忽视 HTML/CSS/JS 基础。 正确做法&#xff…