HunyuanVideo 文生视频工作流指南
概述
本指南详细介绍如何在ComfyUI中使用腾讯混元HunyuanVideo模型进行文本到视频生成的全流程操作,包含环境配置、模型安装和工作流使用说明。
参考:https://comfyui-wiki.com/zh/install/install-comfyui/install-comfyui-on-linux
环境准备
1. ComfyUI安装与更新
- 新安装:参考ComfyUI安装教程
- 更新:确保使用最新版本(需包含
EmptyHunyuanLatentVideo
节点)
注意:必须更新至最新版本才能支持完整功能
模型配置
2.1 主模型
文件名称 | 大小 | 存放路径 |
---|---|---|
hunyuan_video_t2v_720p_bf16.safetensors | 25.6GB | ComfyUI/models/diffusion_models |
2.2 文本编码器
文件名称 | 大小 | 存放路径 |
---|---|---|
clip_l.safetensors | 246MB | ComfyUI/models/text_encoders |
llava_llama3_fp8_scaled.safetensors | 9.09GB | ComfyUI/models/text_encoders |
2.3 VAE模型
文件名称 | 大小 | 存放路径 |
---|---|---|
hunyuan_video_vae_bf16.safetensors | 493MB | ComfyUI/models/vae |
目录结构示例
ComfyUI/
└── models/├── diffusion_models/│ └── hunyuan_video_t2v_720p_bf16.safetensors├── text_encoders/│ ├── clip_l.safetensors│ └── llava_llama3_fp8_scaled.safetensors└── vae/└── hunyuan_video_vae_bf16.safetensors
工作流配置
3. 工作流下载
-
获取地址:HunyuanVideo工作流文件
-
支持分辨率:
比例 | 540p | 720p(推荐) |
---|---|---|
9:16 | 544×960 | 720×1280 |
16:9 | 960×544 | 1280×720 |
1:1 | 720×720 | 960×960 |
核心节点说明
4.1 模型加载
-
UNETLoader:
- 参数:
hunyuan_video_t2v_720p_bf16.safetensors
- 显存优化:可选
fp8
权重类型
- 参数:
-
DualCLIPLoader:
- 双编码器配置:
- CLIP 1:
clip_l.safetensors
- CLIP 2:
llava_llama3_fp8_scaled.safetensors
- CLIP 1:
- 双编码器配置:
4.2 视频生成
-
EmptyHunyuanLatentVideo:
- 关键参数:
Width/Height
、Frame Count(建议129帧)
- 关键参数:
-
CLIPTextEncode:
- 提示词规范:
[主体描述], [动作描述], [场景描述], [风格描述], [质量要求]
示例:
anime girl with fluffy tail, dancing gracefully, cherry blossom garden, studio ghibli style, 4k ultra HD
优化建议
5.1 显存优化
- 使用
VAEDecodeTiled
替代VAEDecode
- 调整参数:
- Tile Size: 256 → 128
- Overlap: 64 → 32
5.2 质量提升
- 采样步数:20-30步
- Guidance Scale:6.0-8.0
- 推荐分辨率:720p(1280×720)
常见问题
❌ 显存不足:
- 解决方案:降低分辨率/使用fp8权重
⏳ 生成缓慢:
- 优化方向:减少帧数/降低采样步数
🖼️ 画质问题:
- 检查要点:
- 提示词详细度
- 采样器选择(euler/dpm++_2m)
- 去噪强度(建议1.0)