深入解析:【Coze】【视频】TK动画视频工作流

news/2025/10/15 15:15:01/文章来源:https://www.cnblogs.com/slgkaifa/p/19143444

深入解析:【Coze】【视频】TK动画视频工作流

今天给大家演示一个以故事生成、标题创作、音频合成与图像生成为核心的 Coze 工作流。该流程通过多节点协作,搞定从文本故事撰写到标题生成,再到音频、字幕和画面内容的自动化生成,最终实现一个完整的多模态内容生产示例。借助大模型的语言与图像能力,用户许可高效创建生动的口播故事、符合平台风格的标题,并将文字转化为音频和画面效果,从而快速构建短视频或多媒体内容。

文章目录

  • 工作流介绍
    • 核心模型
    • Node节点
  • 工作流程
  • 大模型应用
    • 故事文案生成节点
    • 标题生成节点
    • 音频文案优化节点
    • 画面提示词生成节点
  • 使用方法
  • 应用场景
  • 开发与应用

工作流介绍

先利用大模型生成故事文案,再通过标题节点和音频优化节点扩展内容,接着进入循环合成音频和图像,最后结合时间线生成字幕与视频元素。整体流程体现了从文字到音视频再到多模态合成的自动化能力。就是这个工作流的整体逻辑

在这里插入图片描述

核心模型

在这个工作流中,主要依赖大模型来进行故事撰写、标题生成、音频文案优化和画面提示词生成。模型包括Kimi 以及 豆包·1.5·Pro·32k,它们分别承担语言创作与多模态提示词的构建任务。

模型名称说明
Kimi用于故事文案生成与标题创作,负责输出英文口播稿件与 TikTok 风格标题
豆包·1.5·Pro·32k用于音频文案提炼与画面提示词生成,保证多模态内容统一

Node节点

工作流中涉及多个核心节点,既有大模型节点,也有循环节点与插件节点。大模型节点负责生成故事与提示词,循环节点用于批量生成音频与图片,而插件节点则完成语音合成、字幕生成和时间线处理。整体节点配合,使文字、音频和画面素材能够在不同环节顺畅衔接。

节点名称说明
Tk故事撰写基于用户输入关键词生成英文故事口播文案
Tk标题撰写根据故事文案生成 TikTok 风格标题
音频文案优化从故事内容中提取并优化音频文案
音频生成(循环+speech_synthesis)将优化后的文案循环合成为音频
画面提示词描述基于音频文案生成 3D 欧美动画风格画面提示词
循环生成图片(画面生成)根据提示词批量生成画面图像
获取时间线audio_timelines从音频生成对应的时间线信息
时间线_字幕caption_infos按时间线生成字幕材料
时间线_图片imgs_infos按时间线为画面生成配套图片数据
时间线_音频audio_infos结合音频与时间线生成可用于剪辑的音频数据
音频_add_audios批量将音频添加至视频草稿

工作流程

整个工作流按照“文本生成 → 标题创作 → 音频合成 → 图像生成 → 时间线整合 → 多模态输出”的顺序进行。首先,用户输入关键词后,大模型生成完整的英文故事文案。随后,标题节点提炼并生成符合 TikTok 平台风格的标题。接着,借助音频优化节点清理并提取文案内容,进入循环合成音频,并结合时间线插件生成字幕、图片和音频数据。最后,这些素材统一整合到视频草稿中,形成成品。整个流程实现了文字、音频与图像的闭环生成。

流程序号流程阶段工作描述使用节点
1故事生成基于输入关键词生成英文故事口播文案Tk故事撰写
2标题创作结合故事文案生成 TikTok 风格标题Tk标题撰写
3文案优化提取并优化音频文案音频文案优化
4音频合成循环调用语音合成,批量生成音频音频生成(循环 + speech_synthesis)
5提示词生成基于音频文案输出 3D 欧美动画风格提示词画面提示词描述
6图像生成根据提示词循环生成画面图像循环生成图片(画面生成)
7时间线生成从音频提取时间线并匹配画面与字幕audio_timelines + caption_infos + imgs_infos
8音频资料生成按时间线生成音频数据并加入视频草稿audio_infos + add_audios
9成品整合多模态内容统一到视频草稿形成成品视频草稿插件

大模型应用

故事文案生成节点

通过 Prompt 约束,输出适合口播的纯英文故事,语言连贯、逻辑清晰,并严格遵守长度和风格要求。它保证了后续音频和视频生成的核心文本基础。就是在工作流的起点,大模型承担着根据用户输入关键词生成完整英文故事的任务。该节点的设计目标

节点名称Prompt信息说明
Tk故事撰写# 角色
你是一个故事撰写告诉,主要撰写主人和金毛的故事。故事要是纯口播文案。

## 技能
### 技能 1: 生成口播文案
1. 当用户给出关键词后,围绕关键词生成100 - 200字左右、10-20句话、以句号分割的故事口播文案。
2. 文案上下要有逻辑,要连贯,最后一句不需要加句号
3. 文案要是纯英文输出,不得输出汉字。

## 参考故事逻辑:
我有一只特别聪明的金毛寻回犬……(省略示例故事)

## 限制
- 只生成纯口播文案,不添加无关内容。
- 输出的文案应符合口语化表达习惯。
纯英文输出,不得输出汉字。就是- 文案要
该节点的 Prompt 明确要求生成以“主人和金毛”为主角的英文故事,强调故事逻辑性和口语化表达,确保生成的文本可以直接应用于口播场景。

标题生成节点

该节点专注于为生成的故事撰写一个符合 TikTok 平台风格的标题。它的任务是通过分析故事主题,结合趣味性和平台受众偏好,输出一个简洁吸引人的标题。这一环节为视频增加传播力和平台适配性。

节点名称Prompt信息说明
Tk标题撰写# 角色
一位资深且专业的标题撰写专家,用通俗易懂的语言,为给定的文案量身定制符合Tiktok风格的标题。就是你

## 技能
1. 当用户提供故事相关文案后,深入剖析文案主题、养生受众群体特点以及当下宠物故事热点元素。
2. 依据tiktok平台注重趣味性和吸引力的风格,创作贴合tiktok养生受众喜好的标题。

## 限制
- 仅围绕用户提供的故事文案生成抖音平台的标题,不涉及其他无关内容。
- 标题必须符合tiktok平台注重趣味性和吸引力的风格特点,语言风趣且紧密结合当下养生热点。
- 生成的标题需精准针对养生文案所指向的目标群体,表述通俗易懂。
- 仅生成 1 个标题文案 。
- 标题要以纯英文输出,不得输出汉字。
该节点的 Prompt 明确规定了标题的受众和风格,确保输出的标题既能契合 TikTok 平台规则,又能增强短视频内容的点击率和传播效果。

音频文案优化节点

在故事文案生成后,该节点负责从中提取并优化音频文案。它的目标是聚焦核心内容,保证输出的文案能够直接用于音频合成,并且保持英文纯净性。这是故事转化为音频的关键过渡环节。

节点名称Prompt信息说明
音频文案优化# 角色
你是一个数据解析专家,擅长从数组中精准提取关键信息,能够快捷准确地找出每一个数组中的“文案”部分。

## 技能
### 技能 1: 提取文案
1. 当接收到包含数组的信息时,仔细分析每个数组结构。
2. 精准识别并提取出数组中的“文案”部分。
3. 将提取出的“文案”清晰展示给用户。
4. 输出的必须是纯英文文案,不得出现汉字。

## 限制:
- 只专注于从数组中提取“文案”部分,拒绝回答与数组“文案”提取无关的话题。
- 所输出的内容必须清晰展示提取的“文案”,不能偏离此要求。
纯英文文案,不得出现汉字。就是- 输出的必须
该 Prompt 设计的重点是确保从输入数据中提炼出音频可用的纯英文内容,避免冗余信息,保证后续语音合成的清晰度和准确性。

画面提示词生成节点

该节点专注于将故事和音频文案转化为画面提示词。它的职责是以 3D 欧美动画风格为标准,生成符合既定人物形象和宠物形象的画面描述。这一环节为后续的图像生成提供了精准、统一的视觉提示。

节点名称Prompt信息说明
画面提示词描述# 角色
一位专业且经验丰富的 3D 欧美动画画面提示词生成大师,深入洞悉 3D 欧美动画风格的各种元素与独特之处,能够依据多样的输入信息,精准、高水准地生成对应的画面提示词。就是你

## 技能
### 技能 1: 生成画面提示词
1. 深入剖析用户输入的{{input}}信息,精准提炼其中主题、场景、角色等核心要素。
2. 紧密贴合 3D 欧美动画风格,从画面构图、色彩搭配、光影效果、角色姿态等多个维度,创作出详尽且符合风格要求的画面提示词。
3. 生成的提示词数量与{{input}}数量保持一致。
4. 在生成每个提示词时,务必严格参照既定的人物形象与金毛形象,确保形象始终统一。
5. 每个画面提示词都要生动描述故事场景,细致刻画人物的发型、服装,五官,表情等特征,使画面人物统一且富有故事性。

## 主要任务形象描述
…(省略具体人物与金毛的细致形象描述)

## 限制
- 仅围绕根据输入信息生成 3D 欧美动画风格的画面提示词进行回复,坚决不回答无关话题。
- 输出内容要简洁明了、逻辑清晰,严格契合任务要求。
- 生成的每个提示词都要严格参照人物形象与金毛形象,保证形象统一。
生成高质量的画面提示词,确保人物和宠物在不同画面中保持一致性,从而为图像生成奠定坚实基础。就是该 Prompt 的重点

使用方法

开始节点

在开始节点中,用户只需输入关键词作为故事触发条件。输入字段的数据类型为字符串,保证模型能直接调用并生成故事。

字段名含义数据类型
input故事的触发关键词,用于指导故事生成str.String

结束节点

在结束节点中,工作流会输出完整的多模态草稿信息,包含音频、字幕、图片等素材。最终输出的结果可直接作为视频草稿,用于进一步剪辑或直接发布。

字段名含义数据类型
draft_url生成的视频草稿地址,包含整合的多模态内容创建草稿 - draft_url

应用场景

该工作流的应用场景聚焦在多模态短视频和新媒体内容的自动化生产。它不仅能帮助创作者快速生成英文口播故事,还能配合生成标题、音频、字幕和图像,从而直接输出符合 TikTok 等短视频平台的成品。典型用户包括短视频运营者、内容创作者、品牌宣传团队等。他们可借助此工作流缩短制作周期,提升内容质量,并在故事性和视觉表现力上实现统一。最终效果是让用户从一个关键词出发,快速获得完整的短视频素材包,直接进入发布或二次编辑环节。

应用场景使用目标典型用户展示内容实现效果
英文口播短视频制作从关键词到完整视频的自动化生成短视频创作者、运营团队英文口播故事、字幕、音频、图像快速生成多模态短视频成品
品牌宣传自动生产故事化视频素材,强化叙事品牌营销人员故事口播 + TikTok 标题 + 配套画面提升品牌故事感染力与传播效率
教育与培训生成互动式故事视频,增强学习体验教育机构、培训讲师英文故事配字幕和画面辅助语言教学和课堂互动
宠物故事内容创作自动创作宠物主题短视频宠物博主、自媒体人宠物故事文案、语音与图像打造趣味化、系列化宠物故事视频

开发与应用

更多 AIGC 与 Agent工作流 相关研究学习内容请查阅:

AIGC 与 Agent 工作流应用汇总

更多内容桌面应用开发和学习文档请查阅:

AIGC程序平台Tauri+Django环境编写,帮助局域网使用
AIGC软件平台Tauri+Django常见错误与解决办法
AIGC工具平台Tauri+Django内容生产介绍和使用
AIGC设备平台Tauri+Django开源ComfyUI项目介绍和采用
AIGC工具平台Tauri+Django开源git项目介绍和使用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/937555.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java学习2小时教程-【小细节】

1) 数字字符串前面如果带有多余的"000",转换为int的时候,会自动去掉这些0。【和php一样,挺好】,如下: ------------------------------------------javaString str = "000101";int a = Intege…

2025年太阳能板购买全攻略:推荐、选择与性价比分析

文章摘要 本文深入探讨2025年太阳能板的市场趋势、选择方法和购买推荐,帮助用户基于效率、品牌和性价比做出明智决策。内容涵盖太阳能板的基本知识、安装维护指南,以及权威数据支持,旨在促进太阳能板的 adoption,助…

UEFI安装Windows 7 64位

前言 微软从Windows 8开始引入UEFI,最初只支持64位操作系统,后续扩展支持32位。Windows 7 64位操作系统经过改造,可以使用UEFI,但是要开启CSM,无法使用安全启动 准备材料Windows 7 64位中文专业版带sp1官方镜像(…

MySQL,SqlServer,postgresql中,如何实现锁定一张表

MySQL,SqlServer,postgresql中,如何实现锁定一张表最近有个需要求,需要在SqlServer中锁定一张表后,然后搞一些事情,完成后解锁。如何锁定一张表,在MySQL和postgresql中都比较好处理,在SqlServer中并没有对于“…

2025 年展会搭建公司最新推荐排行榜:服务商创意定制与全流程服务能力深度解析

会展经济的蓬勃发展推动展会搭建成为品牌展示的核心载体,但行业痛点却持续制约服务价值释放:设计同质化严重难以匹配品牌个性,施工质量参差暗藏安全隐患,服务链条断裂增加协调成本,预算失控、增项频发更成为企业参…

本地虚拟机windows 安装mysql数据库版本可选,外部如何连接

虚拟机里安装宝塔https://www.bt.cn/new/index.html安装电脑版本, 本地进行数据库版本的选择安装设置数据库的账号密码 http://192.168.57.128:8888/I8H8ufbuLLgJMmWV6gTtaty6 安装heidisql工具链接数据库新建全部变…

2025年常州服装培训学校培训学校推荐榜

随着服装产业升级、智能制造普及及专业技能人才需求增加,服装职业培训已从传统缝纫技能教学逐步转向数字化设计、智能制造管理等多元化方向,2025年市场规模预计持续扩大。但市场增长也带来培训机构教学实力、课程实用…

MLGO微算法科技创新AI技术:基于DRL的设备边缘协同推理优化系统,助力无线智能感知进入“极致高效”时代

在人工智能与物联网技术高速发展的今天,多用户无线传感系统正迅速成为智慧生活、智慧安防和智慧医疗等场景中的关键支撑。然而,如何在资源受限的传感器设备上实现高精度、低延迟的AI推理,仍是一个极具挑战的课题。随…

2025 最新隔音棉生产厂家口碑推荐榜:甄选家装公装专用材质,涵盖西南及全国实力品牌昆明/下水管/阻尼片/专用隔音棉厂家推荐

随着建筑装饰品质升级与家居静音需求激增,隔音棉已成为酒店、KTV、住宅等场景的刚需材料,但市场乱象让采购者陷入选择困境。一方面,公装对定制化、交付效率的高要求与家装对环保、适配性的需求形成差异化痛点,传统…

C 语言 - 操作文件函数全解析

功能分类功能类别 常用函数 解释写文件(输出) fprintf()、fputs()、fputc()、fwrite() 把内容写进文件读文件(输入) fscanf()、fgets()、fgetc()、fread() 从文件读出内容打开/关闭文件 fopen()、fclose() 打开或关…

C 语言 - fopen、fprintf、fread、fwrite、fputc 操作文件函数解析

作用介绍函数名 功能 模式 类比fprintf() 写“文字版”数据到文件 文本模式 把数字写成“字样”fread() 从文件“读二进制”数据 二进制模式 从硬盘拷贝一坨原始数据fwrite() 把内存“原样写入”文件 二进制模式 把内存…

找靠谱图像处理软件?Adobe PS2025 全球设计师都在用

软件介绍 Adobe Photoshop 2025(简称 PS2025)正式版于 2024 年 10 月发布,版本号为 26.2.0。作为 Adobe Creative Cloud 创意云桌面程序中心的核心产品,它不仅是全球最流行的专业图像处理软件,更是平面设计领域与…

2025 碳晶板厂家最新推荐榜:含木纹 / 白色 / 全屋整装等品类,西南及全国优质厂家权威甄选指南

引言随着碳晶板在墙面装饰、全屋整装等领域的应用持续升温,市场需求逐年攀升,但行业乱象也随之凸显。部分品牌以劣质基材冒充优质产品,导致碳晶板出现强度不足、耐候性差等问题,不仅影响装修效果,更潜藏安全隐患;…

状态机

状态机一 传统的switch..case:是状态嵌套事件还是事件嵌套状态,这是一个问题;按照发生概率的大小倒序安排case值顺序;GUN扩展支撑case x..y的写法(即范围在【x,y】之间); 二 指针函数法: typedef enum{ ev_0, e…

2025年麻辣王子全面评测:口味、价格与购买全攻略

文章摘要 麻辣王子作为2025年最受欢迎的辣条零食之一,以其独特口味和健康成分赢得消费者青睐。本文基于用户搜索意图,深入解析麻辣王子的成分、价格、购买渠道及口碑评测,并提供实用技巧。数据支持显示,辣条市场年…

2022 ICPC 香港 L

L. Permutation Compression 数据结构。 首先要让 \(a\) 删除数后得到 \(b\),显然要满足 \(b\) 是 \(a\) 的子集。 因为每次删除的都是最大值,考虑从大往小枚举可删除的数,找左右两边比当前数大的位置,假设 \(l\),…

SQLite批量操作优化方案

using SQLiteBatch.Util; using System.Collections.Concurrent;namespace SQLiteBatch {internal class Program{static ConcurrentQueue<string> SqlQueue = new ConcurrentQueue<string>();static int …

2025 年乡村波形护栏厂家最新推荐排行榜:聚焦优质企业,助力乡村道路安全建设选型参考道路/高速/乡村道路/乡村公路波形护栏板厂家推荐

随着乡村振兴战略持续推进,乡村道路建设规模不断扩大,但道路安全设施配套不足的问题日益凸显,因缺乏有效防护设施导致的交通事故频发,严重威胁村民出行安全。乡村波形护栏作为关键防护设施,其质量与适配性直接影响…

员工签到微信小程序系统:企业考勤管理的高效解决方案

在数字化办公趋势下,传统考勤模式面临效率低、数据难追溯、管理成本高等痛点。基于微擎系统开发的员工签到微信小程序系统,以 “零接触、智能化、多场景适配” 为核心,整合考勤记录、请假审批、积分管理等功能,为企…