网站手机版下悬浮条怎么做青岛微信网站制作

bicheng/2026/1/20 19:40:32/文章来源:
网站手机版下悬浮条怎么做,青岛微信网站制作,学影视后期的正规学校,php网站的数据库怎么做备份文章目录 IntroductionMethodControlNetControlNet for Text-to-Image DiffusionTrainingInference Experiments消融实验定量分析 在作者 github 上的一些讨论消融实验更进一步的探索Precomputed ControlNet 加快模型推理迁移控制能力到其他 SD1.X 模型上其他 Introduction 提… 文章目录 IntroductionMethodControlNetControlNet for Text-to-Image DiffusionTrainingInference Experiments消融实验定量分析 在作者 github 上的一些讨论消融实验更进一步的探索Precomputed ControlNet 加快模型推理迁移控制能力到其他 SD1.X 模型上其他 Introduction 提出ControlNet通过引入该结构微调预训练文生图扩散模型可以给模型增加空间定位条件.在Stable Diffusion上使用ControlNet微调使模型能接受 Canny edges, Hough lines, user scribbles, human key points, segmentation maps, shape normals, depths, cartoon line drawings 图像作为输入条件.消融实验、定量分析、对比 baseline. Method ControlNet 考虑一个预训练好的神经网络 F ( ⋅ ; Θ ) \mathcal{F}(·;\Theta) F(⋅;Θ)表示训练好的神经网络块它的内部结构可以包括 resnet, conv-bn-relu, muti-head att, transfomer 等. 输入 x ∈ R h × w × c x\in\mathbb{R}^{h\times w\times c} x∈Rh×w×c将其转换到 y y y也即 y F ( x ; Θ ) \large y\mathcal{F}(x;\Theta) yF(x;Θ) 使用ControlNet微调神经网络 F ( ⋅ ; Θ ) \mathcal{F}(·;\Theta) F(⋅;Θ)首先复制 F ( ⋅ ; Θ ) \mathcal{F}(·;\Theta) F(⋅;Θ)的结构和参数参数命名为 Θ c \Theta_{c} Θc​同时冻结 Θ \Theta Θ. 然后在复制结构的前和后分别引入zero convolution也即核大小为 1 × 1 1\times1 1×1、初始参数为 0 0 0的卷积层分别用 Z ( ⋅ ; Θ z 1 ) \mathcal{Z}(·;\Theta_{z1}) Z(⋅;Θz1​)和 Z ( ⋅ ; Θ z 2 ) \mathcal{Z}(·;\Theta_{z2}) Z(⋅;Θz2​)表示. 最后将 c c c作为微调时的条件将其整合到模型的前向计算中具体表示为 y c F ( x ; Θ ) Z ( F ( x Z ( c ; Θ z 1 ) ; Θ c ) ; Θ z 2 ) \large y_c\mathcal{F}(x;\Theta)\mathcal{Z}(\mathcal{F}(x\mathcal{Z}(c;\Theta_{z1});\Theta_c);\Theta_{z2}) yc​F(x;Θ)Z(F(xZ(c;Θz1​);Θc​);Θz2​) 模型结构如下所示 在训练的第一步中zero convolution的参数都为 0 0 0因此模型输出和未加入ControlNet的输出一样这样做有助于在刚开始训练时保护微调结构的 backbone使其免受随机噪声的污染. ControlNet for Text-to-Image Diffusion 众所周知Stable Diffusion训练时的网络有这么几个部分构成 FrozenCLIPEmbedder是一个预训练的 text encoder将 prompt 嵌入成条件向量一般情况下参数冻结.AutoencoderKL是一个预训练的 image encoder将图像从像素空间转换到隐空间降低扩散过程中图像向量的尺寸一般情况下参数冻结.UNet主要需要训练的部分模拟隐空间上图像在数据分布和高斯分布之间转换的过程. 结构上主要包含 若干 encoder 块主要由 resnet, transformer, avg_pool 组成用于逐层提取特征. resnet 块融合图像隐向量和扩散时间步的嵌入向量transformer 块融合图像隐向量和 prompt 条件向量 一个 middle 块由 resnet 和 transformer 组成若干 decoder 块主要由 resnet, transformer, interpolate 组成用于融合深层特征和浅层特征. 将ControlNet应用于Stable Diffusion做微调也即应用于其中UNet的 decoder 部分使这部分网络能进一步融合作为条件的图像。用 t t t表示时间步 c t c_t ct​表示 prompt 条件 c f c_f cf​表示条件图像在隐空间上的表示修改后的UNet结构为 Training 用 z 0 z_0 z0​表示原始图像的隐向量经过时间步 t t t后加噪的图像表示为 z t z_t zt​应用了ControlNet的UNet表示为 ϵ θ \epsilon_{\theta} ϵθ​训练时的损失函数可以表示为 L E z 0 , t , c t , c f , ϵ ∈ N ( 0 , I ) [ ∣ ∣ ϵ − ϵ θ ( z t , t , c t , c f ) ∣ ∣ 2 2 ] \large \mathcal{L}\mathbb{E}_{ z_0,t,c_t,c_f,\epsilon\in\mathcal{N}(0,I)}\left[||\epsilon-\epsilon_{\theta}(z_t,t,c_t,c_f)||_2^2\right] LEz0​,t,ct​,cf​,ϵ∈N(0,I)​[∣∣ϵ−ϵθ​(zt​,t,ct​,cf​)∣∣22​] 在实际训练过程中作者随机将 50 % 50\% 50%的 prompt 置为空字符串这种做法能使ControlNet学习到图像条件的语义信息. 由于zero convolution不会引入额外的噪声因此在训练过程中整个Stable Diffusion模型仍然能生成高质量的图片. 基于这一特性作者观察到微调时模型并非逐渐学习到图像条件而是在训练步数低于 10 K 10\mathrm{K} 10K时的某一步开始突然遵从图像条件. 作者称这其为 “sudden convergence phenomenon” Inference Stable Diffusion使用CFG控制条件强弱令 ϵ u c \epsilon_{uc} ϵuc​表示无 prompt 条件的模型输出 ϵ c \epsilon_{c} ϵc​表示有 prompt 条件的模型输出超参数 β c f g \beta_{cfg} βcfg​表示 prompt 条件的强弱模型最终的输出 ϵ p r d \epsilon_{prd} ϵprd​可以表示为 ϵ p r d ϵ u c β c f g ( ϵ c − ϵ u c ) \large \epsilon_{\mathrm{prd}}\epsilon_{\mathrm{uc}}\beta_{\mathrm{cfg}}(\epsilon_{\mathrm{c}}-\epsilon_{\mathrm{uc}}) ϵprd​ϵuc​βcfg​(ϵc​−ϵuc​) 在没有 prompt 条件的极端情况下如果抽取完深层特征的图像条件同时加到 ϵ u c \epsilon_{uc} ϵuc​和 ϵ c \epsilon_{c} ϵc​上这会使CFG完全失去控制条件强弱的作用如果只加到 ϵ c \epsilon_{c} ϵc​上又会使控制条件对输出图像的影响过大. 因此作者提出一种叫做Classifier-free guidance resolution weighting(CFG-RW)的方法. 具体做法把图像条件加到 ϵ c \epsilon_{c} ϵc​上在ControlNet每一层输出加回UNet前乘系数 w i w_i wi​( 64 / h i 64/h_i 64/hi​ h i h_i hi​为第 i i i个 decoder 块的尺寸). 下图分别展示了该讨论各种情况下的输出图像 有了上述方法之后结合不同类别的图像条件也只需要对应相加即可. Experiments 消融实验 探索ControlNet其他可能结构 将zero convolution换成随机初始化的卷积层只使用一个卷积层作为ControlNet 定量分析 作者使用 ADE20K 作为测试集在 OneFormer 上做语义分割对比不同方法重构图像和原图像的 IoU . 之后作者评估了不同模型的 FID、CLIP score、CLIP aesthetic score. 下图展示了不同模型实际生成的图片 在作者 github 上的一些讨论 消融实验更进一步的探索 discussion 链接 将ControlNet简化为ControlNet-lite和ControlNet-mlp两种模型 作者从根据一张房子的图片做了简单地涂鸦风格处理作为控制条件 在精心设计 prompt 的情况下发现原版模型和改后的两种模型输出的图像效果都不错. Professional high-quality wide-angle digital art of a house designed by frank lloyd wright. A delightful winter scene. photorealistic, epic fantasy, dramatic lighting, cinematic, extremely high detail, cinematic lighting, trending on artstation, cgsociety, realistic rendering of Unreal Engine 5, 8k, 4k, HQ, wallpaper 分别为ControlNet、ControlNet-lite、ControlNet-mlp的输出 但是当 prompt 为空时两种改版都很拉胯. 分别为ControlNet、ControlNet-lite、ControlNet-mlp的输出 一方面这样的对比说明更深的 encoder 结构确实拥有更强的识别能力所以如果你的目标是训练稳健的ControlNet投入到生产环境这样的识别能力是很重要的. 反之如果用来做解决特定问题的研究或者训练集足够简单那可以考虑轻量化的方案. 另一方面这也解释了ControlNet接受 prompt 条件和时间步输入是重要的因为这么做可以让使用者仍然能靠 prompt 条件调整模型的输出. Precomputed ControlNet 加快模型推理 discussion 链接 主要 idea 如下图所示 这样做可以提前计算好ControlNet中每个块的输出在推理时直接加到原模型的UNet上. 作者观察到这样训练的模型生成的图像更假并且更不稳健以失败告终. 评论中有人提到可以尝试使用 NAS (neural architecture search) 探索更好的模型结构以降低 GPU 消耗. 迁移控制能力到其他 SD1.X 模型上 discussion 链接 作者尝试将在 Stable Diffusion 1.5上训练的ControlNet迁移到AnythingV3上作者给出的方法是 AnythingV3_control_openpose AnythingV3 SD15_control_openpose – SD15 限制有两点 text encoder 不同会导致意外结果在例如 human pose 的应用中输入最好不是二刺螈人物图片因为检测姿势用的 OpenPose 不擅长处理二刺螈人物. 这种方法已经过时了. 目前在实际应用中直接把ControlNet插到其他 SD1.X 模型上就行. 其他 Riffusion ControlNet 音乐修复将原图转换成像素风格人物换衣调色

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/88418.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

怎么在华为防火墙做网站映射深圳住房建设部网站

查看帮助命令 kubectl --help 具体查看某个操作 kubectl get --help

常州建设工程交易网站wordpress新建文章模型

撰稿|行星 来源|贝多财经 9月5日,乐舱物流股份有限公司(下称“乐舱物流”)通过港交所上市聆讯,并披露了通过港交所聆讯后的资料集(即招股书),中信证券和农银国际为其联席保荐人。 成立于2004…

网站建设销售人才简历crm系统功能模块

背景 当flink消费kafka的消息时,我们经常会用到FlinkKafkaConsumer进行水位线的发送,本文就从源码看下FlinkKafkaConsumer.assignTimestampsAndWatermarks指定周期性水位线发送的流程 FlinkKafkaConsumer水位线发送 1.首先从Fetcher类开始&#xff0c…

河源做网站优化浙江省建设信息网官网

作者主页:paper jie_博客 本文作者:大家好,我是paper jie,感谢你阅读本文,欢迎一建三连哦。 本文于《JavaEE》专栏,本专栏是针对于大学生,编程小白精心打造的。笔者用重金(时间和精力)打造&…

展示型网站建设价格哪个网站有律师做的案件

IPv4 over IPv6隧道: 在IPv4 Internet向IPv6 Internet过渡后期,IPv6网络被大量部署后,而IPv4网络只是散布在世界各地的一些孤岛。利用隧道技术可以在IPv6网络上创建隧道,从而实现IPv4孤岛的互联,IPv4孤岛能通过IPv6公…

专注网站建设11年怎么做网站加盟

一、概述SRM订单管理的概念: SRM订单管理是指在供应商关系管理过程中,有效管理和控制订单的创建、处理和交付。它涉及与供应商之间的沟通、合作和协调,旨在实现订单的准确性、可靠性和及时性。 二、SRM订单管理的流程: 1. 订单创…

怎么样给自己做网站wordpress输出分类目录

一、多级缓存 传统的缓存策略一般是请求到达Tomcat后,先查询Redis,如果未命中则查询数据库,如图: 存在下面的问题: •请求要经过Tomcat处理,Tomcat的性能成为整个系统的瓶颈 •Redis缓存失效时&#xff…

做产品目录的网站网站导航栏设计步骤

一个非常哇塞的在线短剧搜索页面,接口已经对接好了,上传源码到服务器解压就能直接用,有能力的可以自己改接口自己写自己的接口 接口文档地址:doc.djcat.sbs 源码下载地址:https://pan.xunlei.com/s/VNstN8C6N3VK1a1k…

六安网站怎么做seo马克杯在线设计网站

空燃比小于等于1使用下图:空燃比大于1,MAX变MIN,MIN变MAX,高低选互换即可。加负荷,先加空气,后加煤气,降负荷,先降煤气,后降空气。 交叉限幅和双交叉限幅的区别 交叉限幅…

官方网站怎么注册网站域名解绑

Docker Compose 是一种用于定义和运行多容器Docker应用程序的工具。通过Compose,可以使用YAML文件来配置应用程序所需的所有服务,然后使用单个命令创建并启动所有服务。Docker Compose 提供了一种高效、简洁的方式来管理Docker容器和服务,使得…

网站 使用的字体谷歌做公司网站需要多少钱

在过去的几个月中,我越来越多地涉足scala。 Scala与“ Play框架”一起为您提供了一个非常有效且快速的开发环境(即,您掌握了Scala语言的特质之后)。 Play框架背后的家伙一直在努力开发新版本的Play 2.0。 在Play 2.0中&#xff0c…

招聘网站有哪些vs2008 网站消息弹窗怎么做

最近在学tesseract,但遇到太多的问题是。 虽然网上有不少的方法,就算是按照tersseract,github上提供的方法也是编译不成功。 问题一大堆。不过我也想到了其它方法最张还是可以用了。 我有2个方法, 方法1, 1,先build t…

箱包东莞网站建设free wordpress template

jQuery介绍 官方网站: https://jquery.com jQuery 是一个 JavaScript 库 。极大地简化了 JavaScript 编程,例如 JS 原生代码几十行 实现的功 能, jQuery 可能一两行就可以实现,因此得到前端程序猿广泛应用。(现在处在比较边…

网站部分网页乱码seo按天计费系统

我只是把之前的学习笔记整理一下,贴到这里,可能会显得比较凌乱。。。1.1 啥是Docker?Docker 是一个开源项目,它被用来做构建、打包和运行程序。它是一个命令行程序,一个后台进程,也是一组使用逻辑方法来解决常见软件问…

6617网址导航彩票网站大全安全教育平台登录入口

需求:在小程序首页需要显示用户所在城市。 解决方案:使用wx.getLocation获取经纬度坐标,再使用微信小程序JavaScript SDK的地址逆解析方法reverseGeocoder,就可以完美搞定。 微信小程序JavaScript SDK官方地址 https://lbs.qq.c…

湖滨网站建设响应式网站概况

疫情期间,远程研发协作办公成为各企业的主要工作方式,本文将明源云以往的研发实践,结合本次远程办公的实际经验,分享一下面对跨地区多团队,如何高效在线协同,保证研发质量与效率的实践经验。面对当前严重的…

wordpress网站 添加微信支付做贸易网站

Kotlin 协程:深入理解 ‘lifecycleScope’ Kotlin 协程是一种强大的异步编程工具,它提供了一种简洁、易读的方式来处理并发和异步操作。在 Kotlin 协程库中,lifecycleScope 是一个关键的概念,它允许我们将协程的生命周期绑定到 An…

普陀区网站建设公司南通seo快速排名

本文介绍 Ubuntu 桌面系统升级的两种方式,通过 UI 或命令行的方式,演示为 20.04 升级为 22.04。并介绍了 windows 的 Linux 子系统 wsl 的升级注意事项。背景之前在学习 ROS2 时,安装 ros-humble-desktop 出现依赖错误:无法修正错…

山西建设公司网站小程序登录功能

1.概述 在13.0的系统产品rom定制化开发中,有些产品需要对Launcher3中桌面显示的app的icon做替换,如果没有源码的话更换会麻烦点,需要从pms解析app的时候, 可以替换掉app的icon图标就可以了,接下来就来实现相关的功能 2.无源码app修改它的icon图标的相关核心类 framework…

菏泽做网站的公司html5素材网

使用poi导出的execl合并单元格,会出现下图问题整个单元格看似合并了,但是文字没有垂直居中,而且execl中所有的合并都会在第三行开始出现灰色分层样式合并单元格伪代码String upCompareField ""; //上一行的对比值for(int i 0; i …