Stable Diffusion lora训练(一)

一、不同维度的LoRA训练步数建议

  1. 2D风格训练

    • 数据规模:建议20-50张高质量图片(分辨率≥1024×1024),覆盖多角度、多表情的平面风格。
    • 步数范围:总步数控制在1000-2000步,公式为 总步数 = Repeat × Image × Epoch / Batch_size
    • 示例:Image=30张,Repeat=10,Epoch=5,Batch_size=2 → 750步(偏低,需增加Epoch至10)。
      在这里插入图片描述
  2. 2.5D风格训练

    • 数据规模:30-60张图片,需兼具平面与立体细节(如半厚涂、轻3D渲染)。
    • 步数范围:推荐1500-3000步,通过提高Epoch(8-12轮)增强细节捕捉能力。
  3. 3D风格训练

    • 数据规模:50-100张高精度建模图,需包含光影、材质、多视角特征。
    • 步数范围:建议15000步左右,搭配Dadaptation优化器动态调整学习率。

二、不同底模的步数适配策略

底模类型适用场景步数调整要点推荐总步数范围
Pony二次元、轻量化风格降低Epoch(5-8轮),防止过拟合800-1500步
F1厚涂、ACG风格提高Repeat至12-15次以强化质感1200-2500步
SD1.5通用型、人像与场景兼容标准参数(Repeat=10,Epoch=10)1000-2000步
Illustrious高精度3D与写实风格增大Batch_size(4-6)以加速深度训练2000-3000步

三、LoRA训练小技巧

数据预处理优化

  • 使用智能裁剪工具(如ComfyUI)聚焦主体,避免“截肢”或背景干扰。
  • 结合BLIP或WD 1.4 Tagger生成标签后,手动补充细节描述(如材质、光源)。

参数调优技巧

  • 学习率平衡:Unet学习率设为0.0001-0.001,Text Encoder学习率降低至其1/5-1/10。
  • 正则化图像:添加5-10张非目标风格图片(如素描),提升模型泛化性。

硬件适配策略

  • 显存≤6G时,Batch_size=1,通过提高Repeat或Epoch补偿训练强度。
  • 显存≥12G时,Batch_size=4-6,结合梯度累积加速收敛。

模型性能评估

  • Loss率监控:保持Loss在0.3-0.5区间,过低(<0.1)可能过拟合。
  • 多轮次保存:每轮训练保存模型,测试时选择泛化性与细节平衡的版本。

四、典型训练方案示例

场景底模Image数量RepeatEpochBatch_size总步数
轻量2D角色训练Pony25张1062750步
深度3D材质训练F150张151041875步
通用写实场景训练SD1.540张12831280步

总结

  • 训练步数需根据公式动态调整,优先保证数据质量与标签精准度。
  • 2D/2.5D场景推荐1000-3000步,3D场景建议提升至1500步以上。
  • 底模选择上,SD1.5和Illustrious适合通用需求,Pony/F1需针对性优化参数。
  • 结合正则化图像与学习率平衡策略,可显著提升模型泛化性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/73017.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI 生成 PPT 网站介绍与优缺点分析

随着人工智能技术不断发展&#xff0c;利用 AI 自动生成 PPT 已成为提高演示文稿制作效率的热门方式。本文将介绍几款主流的 AI PPT 工具&#xff0c;重点列出免费使用机会较多的网站&#xff0c;并对各平台的优缺点进行详细分析&#xff0c;帮助用户根据自身需求选择合适的工具…

使用Systemd管理ES服务进程

Centos中的Systemd介绍 CentOS 中的 Systemd 详细介绍 Systemd 是 Linux 系统的初始化系统和服务管理器&#xff0c;自 CentOS 7 起取代了传统的 SysVinit&#xff0c;成为默认的初始化工具。它负责系统启动、服务管理、日志记录等核心功能&#xff0c;显著提升了系统的启动速…

【一维前缀和与二维前缀和(简单版dp)】

1.前缀和模板 一维前缀和模板 1.暴力解法 要求哪段区间&#xff0c;我就直接遍历那段区间求和。 时间复杂度O(n*q) 2.前缀和 ------ 快速求出数组中某一个连续区间的和。 1&#xff09;预处理一个前缀和数组 这个前缀和数组设定为dp&#xff0c;dp[i]表示&#xff1a;表示…

在Windows和Linux系统上的Docker环境中使用的镜像是否相同

在Windows和Linux系统上的Docker环境中使用的镜像是否相同&#xff0c;取决于具体的运行模式和目标平台&#xff1a; 1. Linux容器模式&#xff08;默认/常见场景&#xff09; Windows系统&#xff1a; 当Windows上的Docker以Linux容器模式运行时&#xff08;默认方式&#xf…

植物来源药用天然产物的合成生物学研究进展-文献精读121

植物来源药用天然产物的合成生物学研究进展 摘要 大多数药用天然产物在植物中含量低微&#xff0c;提取分离困难&#xff1b;而且这些化合物一般结构复杂&#xff0c;化学合成难度大&#xff0c;还容易造成环境污染。基于合成生物学技术获得药用天然产物具有绿色环保和可持续发…

JavaScript |(五)DOM简介 | 尚硅谷JavaScript基础实战

学习来源&#xff1a;尚硅谷JavaScript基础&实战丨JS入门到精通全套完整版 笔记来源&#xff1a;在这位大佬的基础上添加了一些东西&#xff0c;欢迎大家支持原创&#xff0c;大佬太棒了&#xff1a;JavaScript |&#xff08;五&#xff09;DOM简介 | 尚硅谷JavaScript基础…

浏览器工作原理深度解析(阶段二):HTML 解析与 DOM 树构建

一、引言 在阶段一中&#xff0c;我们了解了浏览器通过 HTTP/HTTPS 协议获取页面资源的过程。本阶段将聚焦于浏览器如何解析 HTML 代码并构建 DOM 树&#xff0c;这是渲染引擎的核心功能之一。该过程可分为两个关键步骤&#xff1a;词法分析&#xff08;Token 化&#xff09;和…

The Illustrated Stable Diffusion

The Illustrated Stable Diffusion 1. The components of Stable Diffusion1.1. Image information creator1.2. Image Decoder 2. What is Diffusion anyway?2.1. How does Diffusion work?2.2. Painting images by removing noise 3. Speed Boost: Diffusion on compressed…

yarn 装包时 package里包含sqlite3@5.0.2报错

yarn 装包时 package里包含sqlite35.0.2报错 解决方案&#xff1a; 第一步&#xff1a; 删除package.json里的sqlite35.0.2 第二步&#xff1a; 装包&#xff0c;或者增加其他的npm包 第三步&#xff1a; 在package.json里增加sqlite35.0.2&#xff0c;并运行yarn装包 此…

一个免费 好用的pdf在线处理工具

pdf24 doc2x 相比上面能更好的支持数学公式。但是收费

buu-bjdctf_2020_babystack2-好久不见51

整数溢出漏洞 将nbytes设置为-1就会回绕&#xff0c;变成超大整数 从而实现栈溢出漏洞 环境有问题 from pwn import *# 连接到远程服务器 p remote("node5.buuoj.cn", 28526)# 定义后门地址 backdoor 0x400726# 发送初始输入 p.sendlineafter(b"your name…

DHCP 配置

​ 最近发现&#xff0c;自己使用虚拟机建立的集群&#xff0c;在断电关机或者关机一段时间后&#xff0c;集群之间的链接散了&#xff0c;并且节点自身的 IP 也发生了变化&#xff0c;发现是 DHCP 的问题&#xff0c;这里记录一下。 DHCP ​ DHCP&#xff08;Dynamic Host C…

股指期货合约的命名规则是怎样的?

股指期货合约的命名规则其实很简单&#xff0c;主要由两部分组成&#xff1a;合约代码和到期月份。 股指期货合约4个字母数字背后的秘密 股指期货合约一般来说都是由字母和数字来组合的&#xff0c;包含了品种代码和到期的时间&#xff0c;下面我们具体来看看。 咱们以“IF23…

OSPF 协议详解:从概念原理到配置实践的全网互通实现

什么是OSPF OSPF&#xff08;开放最短路径优先&#xff09;是由IETF开发的基于链路状态的自治系统内部路由协议&#xff0c;用来代替存在一些问题的RIP协议。与距离矢量协议不同&#xff0c;链路状态路由协议关心网络中链路活接口的状态&#xff08;包括UP、DOWN、IP地址、掩码…

深入探究 JVM 堆的垃圾回收机制(二)— 回收

GC Roots 枚举需要遍历整个应用程序的上下文&#xff0c;而在进行可达性分析或者垃圾回收时&#xff0c;如果我们还是进行全堆扫描及收集&#xff0c;那么会非常耗时。JVM 将堆分为新生代及老生代&#xff0c;它们的回收频率及算法不一样。 1 回收算法 在进行可达性分析时&am…

蓝桥杯 之 数论

文章目录 习题质数找素数 数论&#xff0c;就是一些数学问题&#xff0c;蓝桥杯十分喜欢考察&#xff0c;常见的数论的问题有&#xff1a;取模&#xff0c;同余&#xff0c;大整数分解&#xff0c;素数&#xff0c;质因数&#xff0c;最大公约数&#xff0c;最小公倍数等等 素…

Unity Shader编程】之渲染流程之深度及pass详解

关于透明物体的渲染&#xff0c;首先需要了解以下部分 深度缓冲区深度写入深度测试pass渲染和深度测试的过程深度测试和颜色混合过程 ** 一&#xff0c;深度缓冲区 ** 深度即物体距离相机的距离&#xff0c;深度写入即是把物体的距离相机信息记录下来&#xff0c;写入一个名…

csv文件格式和excel数据格式有什么区别

CSV&#xff08;Comma-Separated Values&#xff09;和Excel&#xff08;XLS/XLSX&#xff09;数据格式的主要区别如下&#xff1a; 1. 文件格式 CSV&#xff1a;纯文本格式&#xff0c;每一行表示一条记录&#xff0c;字段之间用逗号&#xff08;,&#xff09;或其他分隔符&…

Beans模块之工厂模块注解模块@Qualifier

博主介绍&#xff1a;✌全网粉丝5W&#xff0c;全栈开发工程师&#xff0c;从事多年软件开发&#xff0c;在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战&#xff0c;博主也曾写过优秀论文&#xff0c;查重率极低&#xff0c;在这方面有丰富的经验…

C# HTTP 文件上传、下载服务器

程序需要管理员权限&#xff0c;vs需要管理员打开 首次运行需要执行以下命令注册URL&#xff08;管理员命令行&#xff09; netsh advfirewall firewall add rule name"FileShare" dirin actionallow protocolTCP localport8000 ipconfig | findstr "IPv4&quo…