陕西建设厅网站人才库外包人力资源公司
news/
2025/9/23 1:12:46/
文章来源:
陕西建设厅网站人才库,外包人力资源公司,网上营销推广方案,有专业做淘宝网站的美工吗一、GAN原理
出发点#xff1a;机器学习中生成模型的问题 无监督学习是机器学习和未来人工智能的突破点#xff0c;生成模型是无监督学习的关键部分
特点#xff1a;
不需要MCMC或者变分贝叶斯等复杂的手段#xff0c;只需要在G和D中对应的多层感知机中运行反向传播或者…一、GAN原理
出发点机器学习中生成模型的问题 无监督学习是机器学习和未来人工智能的突破点生成模型是无监督学习的关键部分
特点
不需要MCMC或者变分贝叶斯等复杂的手段只需要在G和D中对应的多层感知机中运行反向传播或者梯度下降算法模型通常使用神经网络其拟合能力最好 G(Generator)用于捕获数据分布的生成模型(生成图像的网络)接收到随机的噪声z通过噪声z生成图像。尽可能多地模拟、建模和学习真实数据的分布规律。
D(Discriminator)用于判别数据是真实数据还是生成数据(伪数据)的判别模型(判别图像真伪的网络)输入一张图像输出代表其为真实图像的概率值100%即判断该图像是真的。
训练过程 通过对抗性过程同时训练两个模型训练过程中生成器逐渐擅长创建更为真实的图像鉴别器逐渐擅长判断真伪当鉴别器没有办法判断图像真伪时该训练过程达到平衡。
动态博弈过程G尽可能生成真实的图像欺骗判别网络DD尽量区别G生成的图像和真实的图像博弈结果理想情况下达到纳什均衡点G生成可以“以假乱真”的图像 D(x)D网络判断真实图片是否真实的概率因为x本来就是真实的所以该值越接近1越好
D(G(z))D网络判断G生成的图片是否真实的概率
对于GG希望自己生成的图片越接近真实越好即G希望D(G(z))尽可能大V(D, G)会变小所以对于G是min_G
对于DD的能力越强D(x)越大D(G(x))越小V(D,G)会变大所以对于D是求最大max_D
二、GAN框架 第一步训练D时V(G, D)越大越好所以加上梯度ascending
第二步训练G时V(G, D)越小越好所以减去梯度descending
整个训练过程交替进行
体系结构
传统生成模型的优化目标数据的似然GAN创新地使用另外一个优化目标①引入判别模型②优化过程是在生成模型和判别模型之间找纳什均衡
三、GAN实现过程 1.前向传播阶段
模型输入 随机产生一个随机向量作为生成模型的输入数据然后经过生成模型后产生一个新的向量即为Fake Image 从数据集中随机选择一张图片将图片转化成向量即为Real Image
模型输出 fake image和real image是判别网络的输入根据输入的图片类型是Fake Image或Real Image将判别模型的输入数据的label标记为0或者1。即判别模型的输入类型为(xfake,0)或者(xreal,1)。 经过判别网络后输出一个0到1之间的数用来表示输入图片为真实图像的概率。
2.反向传播阶段—优化目标 ①优化D
②优化G
3.损失函数 希望生成样本和真实样本拥有相同的概率密度函数 GAN的损失函数源自于二分类对数似然函数的交叉熵损失函数。第一项是使正样本的识别结果尽量为 1 第二项是使负样本的预测值尽量为 0 损失函数 4.迭代更新
得到损失函数后按照单个模型的更新方法进行修正
四、GAN特性 采用对抗思想的原因评估一个生成样本的质量是一个很难量化的指标。对抗思想把评估生成样本的质量的任务交给一个判别器模型去做
特点 传统模式相比有两种不同的网络采用对抗训练方法
缺点 训练GAN需要达到Nash均衡有时候可以通过梯度下降方法实现有时候不能 GAN不适用于处理离散数据如文本 GAN存在训练不稳定、梯度消失和模态崩溃等问题
五、GAN应用 用于无监督学习和半监督学习 GAN与强化学习相结合 图像样式转换、图像降噪和恢复、图像超分辨率 计算机视觉图像、文本、语音或者任何含有规律的数据合成 用于分类领域将判别器替换为分类器执行多个分类任务
六、其他
①早停法(Early Stopping) 生成器或鉴别器损失突然增加或减少 损失函数随机上升或下降可能得到生成器的损失远远高于判别器的损失
②处理Mode Collapse(模式坍塌|生成器”崩溃”总是将每一个输入的隐向量生成单一的样本)问题时尝试使用较小的学习率并从头开始训练
③添加噪声在真实数据和合成数据中添加噪声提高判别器的训练难度有利于提高系统的整体稳定性
④标签平滑将标签值设置成一个低一些的值阻止判别器对分类标签过于确信
⑤多尺度梯度(处理不太小的尺度时使用)由于两个网络之间的多个跳连接梯度流从判别器流向生成器和传统的用于语义分割的U-Net类似
⑥双时间尺度更新规则使用不同的学习速率为判别器选择一个更高的学习率(生成器必须用更小的更新幅度来欺骗判别器不会选择快速、不精确和不现实的方式赢得博弈)。使用TTUR时生成器有更大的损失量
⑦谱归一化应用于卷积核的一种特殊的归一化可以极大地提高训练的稳定性 参考链接GAN-生成对抗性神经网络 - 知乎
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/910967.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!