基于Qwen的儿童内容生成系统搭建：生产环境部署教程

1. 引言

随着人工智能在内容创作领域的深入应用，大模型驱动的图像生成技术正逐步进入教育、娱乐等垂直场景。其中，面向儿童的内容生成因其对安全性、审美风格和语义理解的特殊要求，成为一项具有挑战性的工程任务。

当前市面上多数通用图像生成模型虽然具备强大的绘图能力，但在生成内容的适龄性、画风一致性以及语言理解准确性方面难以满足儿童使用场景的需求。例如，直接输入“小兔子在草地上玩耍”可能生成过于写实或包含复杂背景的图像，不利于低龄儿童的认知发展。

为解决这一问题，我们基于阿里通义千问（Qwen）大模型，构建了一套专用于生成可爱风格动物图片的定制化系统 ——Cute_Animal_For_Kids_Qwen_Image。该系统通过微调提示工程、优化工作流结构，并集成安全过滤机制，确保输出内容符合儿童审美与认知特点，适用于绘本制作、早教课件设计、亲子互动应用等实际业务场景。

本教程将详细介绍如何在生产环境中部署并运行该系统，涵盖环境准备、工作流配置、参数调整及批量生成建议，帮助开发者快速实现从模型调用到产品落地的全流程闭环。

2. 系统架构与核心组件

2.1 整体架构设计

Cute_Animal_For_Kids_Qwen_Image 是一个基于 ComfyUI 可视化工作流平台构建的图像生成系统，其核心依赖于 Qwen-VL 多模态大模型的文本理解能力，并结合 Stable Diffusion 系列扩散模型完成高质量图像渲染。

系统整体分为三层：

输入层：接收用户以自然语言描述的动物名称及简单动作指令（如“小熊跳舞”、“小猫钓鱼”）
处理层：由 ComfyUI 工作流调度，调用 Qwen 模型进行语义解析与提示词增强，自动生成符合儿童画风的详细 prompt
输出层：交由轻量化 diffusion 模型（如 TinyLlama-Diffusion 或 SDXL-Light）执行图像合成，最终返回 512×512 分辨率的 PNG 图像

该架构优势在于： - 利用 Qwen 的强语义理解能力提升提示词质量 - 通过固定工作流保证输出风格统一 - 支持异步队列处理，适合高并发服务部署

2.2 核心模块说明

提示词增强引擎

系统内置一套针对儿童内容优化的提示模板库，格式如下：

{animal} in cartoon style, cute face, big eyes, soft fur, pastel colors, white background, children's book illustration

当用户输入“小狗”时，Qwen 自动补全为：“a small puppy in cartoon style, cute face, big eyes, wearing a red bowtie, playing with a ball, pastel colors, white background, children's book illustration”。

此过程通过 ComfyUI 中的LLM Prompt Generator节点实现，支持动态插入情感词（happy, sleepy）、服饰元素（hat, dress）等扩展属性。

安全过滤机制

为防止意外生成不适宜内容，系统集成双层过滤策略：

关键词黑名单检测：拦截暴力、恐怖、成人相关词汇
图像后验审核：使用轻量级 CNN 分类器对生成结果做二次筛查，识别异常纹理或结构

所有过滤规则均可通过 JSON 配置文件热更新，便于运营维护。

3. 生产环境部署步骤

3.1 环境准备

部署前需确保服务器满足以下最低配置：

组件	要求
CPU	Intel Xeon 8核以上
GPU	NVIDIA RTX 3090 / A100（显存 ≥ 24GB）
内存	≥ 32GB
存储	≥ 100GB SSD（含模型缓存空间）
操作系统	Ubuntu 20.04 LTS 或更高版本

安装依赖项：

# 更新系统包 sudo apt update && sudo apt upgrade -y # 安装 Python 3.10 和 pip sudo apt install python3.10 python3-pip git docker.io docker-compose -y # 克隆 ComfyUI 项目 git clone https://github.com/comfyanonymous/ComfyUI.git cd ComfyUI # 安装 Python 依赖 pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu118 pip install -r requirements.txt

3.2 模型下载与加载

下载 Qwen-VL 模型

前往 Hugging Face 获取 Qwen-VL-Chat 模型权重：

mkdir models/qwen cd models/qwen wget https://huggingface.co/Qwen/Qwen-VL-Chat/resolve/main/pytorch_model.bin wget https://huggingface.co/Qwen/Qwen-VL-Chat/resolve/main/config.json wget https://huggingface.co/Qwen/Qwen-VL-Chat/resolve/main/tokenizer.model

加载扩散模型

推荐使用已训练好的卡通风格模型，例如：

ToonYou:toonyou_beta6.safetensors
Children’s Book Illustration Model:childbook_v1.safetensors

将模型文件放置于ComfyUI/models/checkpoints/目录下。

3.3 导入工作流

Step 1：进入 ComfyUI 模型显示入口

启动 ComfyUI 服务：

python main.py --listen 0.0.0.0 --port 8188

浏览器访问http://<your-server-ip>:8188进入可视化界面。

Step 2：导入预设工作流

点击右上角「Load」按钮，选择本地保存的工作流 JSON 文件：

{ "last_node_id": 12, "last_link_id": 10, "nodes": [ { "id": 1, "type": "LLMPrompt", "widgets_values": ["{{input}}", "Qwen-VL-Chat"] }, { "id": 2, "type": "KSampler", "widgets_values": [20, 8, 1.5] }, ... ] }

或直接从资源库中选择预置工作流：

提示
在工作流管理面板中搜索Qwen_Image_Cute_Animal_For_Kids并加载。

Step 3：修改提示词并运行

在Text Encode (Prompt)节点中，编辑基础描述字段。例如：

Generate a cute little panda bear sitting under a tree, holding a balloon, cartoon style, bright colors, simple background

可替换关键词部分使用变量占位符：

Generate a cute little {{animal}} {{action}}, cartoon style, bright colors, simple background

随后点击主界面右上角「Queue Prompt」提交任务，系统将在 10~15 秒内返回生成图像。

4. 批量生成与 API 封装建议

4.1 批量生成脚本示例

为提高效率，可通过 ComfyUI 的 REST API 实现自动化调用。以下是一个 Python 批量生成脚本：

import requests import json API_URL = "http://localhost:8188/prompt" CLIENT_ID = "cute_animal_kids" def queue_prompt(prompt): data = {"prompt": prompt, "client_id": CLIENT_ID} response = requests.post(API_URL, json=data) return response.json() # 构建提示词模板 animals = ["kitten", "puppy", "bunny", "duckling", "elephant"] actions = ["playing with a ball", "sleeping in a basket", "eating honey", "flying with wings"] for animal in animals: for action in actions[:2]: # 每种动物生成两个动作 prompt_text = f"Generate a cute little {animal} {action}, cartoon style, pastel colors, white background" # 构造完整工作流数据（简化版） workflow = { "6": { # LLM Prompt Node "inputs": { "text": prompt_text } } } result = queue_prompt(workflow) print(f"Submitted: {animal} - {action}")

4.2 API 接口封装建议

建议在 Nginx + Flask 层封装对外接口，提供标准 HTTP 调用方式：

from flask import Flask, request, jsonify import uuid import os app = Flask(__name__) @app.route("/generate", methods=["POST"]) def generate_image(): data = request.json animal = data.get("animal", "cat") action = data.get("action", "sitting") # 触发 ComfyUI 生成 task_id = str(uuid.uuid4()) # 此处调用 queue_prompt(...) 并监听完成事件 return jsonify({ "task_id": task_id, "status": "queued", "image_url": f"/results/{task_id}.png" })

配合 Redis 队列与 WebSocket 回调，可实现状态推送与异步通知。