实用指南:85-dify案例分享-不用等 OpenAI 邀请,Dify+Sora2工作流实测:写实动漫视频随手做,插件+教程全送

news/2025/10/19 15:29:31/文章来源:https://www.cnblogs.com/ljbguanli/p/19150894

实用指南:85-dify案例分享-不用等 OpenAI 邀请,Dify+Sora2工作流实测:写实动漫视频随手做,插件+教程全送

1.前言

Sora 2 是 OpenAI 在 2025 年推出的下一代 AI 视频生成模型,也是继 Sora 1 后的重大升级。它能够同步生成音频与视频,在物理运动、身体力学和场景交互方面实现了更高的真实感和可控性,能够生成从写实电影画面到动漫风格的短片,并协助将真实人物或宠物“客串”进生成的虚拟场景(Cameo 效果)。

img

下面生成的效果展示

img

img

上面的这些视频我是使用dify来达成的。工作流截图如下:

img

img

这里我们使用到一个基于soar2的文生视频的一个插件。目前这个插件是我自己开发还没上传到dify插件市场,晚些时间准备上传提交到dify插件市场,感兴趣的小伙伴行在插件市场上下载这个插件并启用这个工作流来实现视频制作。那么这样的工作流是如何制作的呢?

话不多说下面带大家拆解一下这个工作流。

2.工作流制作

制作该工具流之前我们需安装这个插件。插件名字叫做sora2。我们启用本地方式安装这个插件。

img

img

安装完成后我们在已安装插件找到我们刚才安装好的插件。

img

插件授权

考虑到很多国内小伙伴没办法使用这个最新的sora2,我们这里借助302AI给出的接口。

img

可以去302AI注册一个账号。然后添加APIkey ,目前这个sora2 国庆期间限时免费,大家可以借这个时间免费运用sora2

img

复制从302AI网站创建的apikey 添加到这个插件授权。

img

看到下面的画面完成授权

img

工作流节开始

我们回到dify工作流工作流工作台,点击创建一个chatflow

img

这个开始节点我们不设置提示词,就让用户输入提示词就可能了,所以这块设置比较简单

img

soar2文生视频插件

大家从工作流画布中使用到上面安装的插件,安装下面步骤拖拽到工作流画布中

img

这个插件有2个参数,一个是接受用户的提示词,一个是视频方向。目前这个接口还不完善,视频方向16:9 和 9:16的 目前还不能用。目前不管设置16:9 还是9:16 视频生成都是基于9:16的。预留这个参数主要考虑后面接口完毕方便可扩展性。

img

输入变量这里结束开始节点插入的sys.query即可。

代码执行

这个代码处理关键的目的是是生成的视频后解析插件返回的信息。输入的参数arg1 输入值就是插件返回的字符串

处理代码

import re
def main(arg1: str) -> dict:
"""
从插件返回的字符串中提取视频URL并返回markdown格式
Args:
arg1: 插件返回的包含视频URL的字符串
Returns:
包含markdown视频链接的字符串
"""
# 使用正则表达式提取视频URL
# 匹配 https://filesystem.site/...src.mp4?... 格式的URL
url_pattern = r'https://filesystem\.site/[^\s]+src\.mp4\?[^\s\n]+'
url_match = re.search(url_pattern, arg1)
if url_match:
video_url = url_match.group(0)
# 返回markdown格式的视频链接
markdown_result = f"[![视频预览]({video_url})]({video_url})\n\n[ 点击观看视频]({video_url})"
return {"result": markdown_result}
else:
return {"result": "❌ 未找到视频URL"}

输出变量,result 返回类型是string

img

直接返回

直接返回这里我们就接受文生视频接口返回信息,以及代码处理后的出来结果2个参数

img

依据以上步骤我们就完成了dify工作流的制作。

3.插件说明

插件源代码我们已经上传到github上了。可以借助源码编译打包成sora2.difypkg 来实现。

项目地址https://github.com/wwwzhouhui/sora2

img

对如何编译打包这块不了解的行看我之前的文章 《dify案例分享-零基础上手 Dify TTS 插件!从开发到部署免费文本转语音,测试 + 打包教程全有》

倘若有小伙伴不想用下载源码 直接想用这个插件我这边上传到百度网站提供下载,地址
链接: https://pan.baidu.com/s/1tkPzdgXa-XY-K3ELmQGO3w?pwd=9vdy 提取码: 9vdy

4.总结

今天核心带大家了解并搭建了基于 Dify 工作流构建 Sora 2 文生视频功能的完整流程,该流程以 OpenAI 推出的 Sora 2 模型为核心,结合 Dify 平台灵活的工作流节点配置(如插件调用、代码执行解析、结果封装等),形成了一套覆盖文本生成视频的全流程方案。

通过这套实践方案,用户能够低成本体验 Sora 2 的强大生成能力 —— 借助 302AI 提供的限时免费接口和 Dify 平台的可视化配置,无需麻烦的技术开发,就能快速实现音频与视频同步生成、真实感场景创作等功能,极大降低了 AI 视频创作的使用门槛。在实际验证中,该工作流能够稳定响应不同风格的生成需求,无论是写实电影画面还是动漫风格短片,都能产出符合预期的内容,有效解决了普通用户调用 Sora 2 时地域限制、操作复杂的问题。同时,工作流具备良好的扩展性 —— 小伙伴们能够基于此框架扩展更多实用功能,如自媒体的短视频素材制作、教育领域的动态演示生成、创意行业的剧情可视化等,进一步丰富 Dify 平台的视频创作应用场景。

感兴趣的小伙伴可以按照这份指南尝试搭建自己的 Sora 2 生成工作流,甚至结合其他 AI 工具拓展更多创意玩法。今天的分享就到这里结束了,我们下一篇文章见。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/940372.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

uml九大图 - 作业----

uml九大图统一建模语言(UML)九大图详解 统一建模语言(UML)是一种标准化的建模语言,广泛应用于软件工程领域,用于对软件密集型系统进行可视化、详述、构造和文档化。它如同建筑师的蓝图,为软件开发团队提供了一套…

GapBuffer高效标记管理算法

目录引言GapBuffer 基本思想基本操作基于下标映射的标记记录法下标映射搜索维护对比总结 引言 最近笔者正在优化 Android 开源代码编辑器项目 TextWarrior 的一些算法,包括时间、空间两方面。TextWarroir 的文本编辑器…

2025年变位机厂家推荐排行榜,焊接变位机,双轴变位机,高精度智能变位机公司推荐!

2025年变位机厂家推荐排行榜,焊接变位机,双轴变位机,高精度智能变位机公司推荐!随着工业自动化和智能制造的快速发展,变位机、焊接变位机和双轴变位机在制造业中的应用越来越广泛。这些设备不仅能够提高生产效率,…

stable-virtio

https://fedorapeople.org/groups/virt/virtio-win/direct-downloads/

2025年中医师承与确有专长培训机构推荐榜单:权威认证,传承经典,专业师资助力中医梦想!

2025年中医师承与确有专长培训机构推荐榜单:权威认证,传承经典,专业师资助力中医梦想!随着中医药事业的蓬勃发展,越来越多的人开始关注并投身于中医的学习和实践。中医师承与确有专长培训作为培养中医人才的重要途…

从数学概念到图像识别,再到 CNN 的联系

在矩阵论和信号处理中,奇异值分解(Singular Value Decomposition, SVD) 是一个极其重要的工具。它不仅是一个数学分解公式,更是连接数据压缩、特征提取和深度学习优化的桥梁 。 矩阵与奇异值的定义对任意矩阵 \(A …

2025流量计厂家推荐弗罗迈测控,高精度耐腐蚀多种类选择!

2025流量计厂家推荐弗罗迈测控,高精度耐腐蚀多种类选择!随着工业自动化和智能化的快速发展,流量计作为关键的测量设备,在各个行业中扮演着越来越重要的角色。特别是在2025年,随着技术的不断进步和市场需求的多样化…

关于代码规范的自我约束

关于代码规范的自我约束1.变量名不用拼音或单个字母,比如不用 “shuzu”“a”,改用 “studentList”“count”,让人一看就知道啥意思。 2.写代码前先空两格缩进,同一层的代码对齐,像排队一样整齐,嵌套多了也不乱…

7.switch语句的简单应用

swtich分支语法 switch分支结构用于在多个可能的情况下选择一种情况进行处理。以下是switch分支结构的基本语法: 另一种排版习惯: 当变量表达式所表达的量与其中一个case分支中的常量相符时,就执行此case分支后面的…

在AI技术唾手可得的时代,挖掘电池管理工具的新需求成为关键

本文分析了一款针对Apple Silicon Mac设备的电池充电限制工具,探讨其核心功能、应用场景及用户使用方式,并基于大量用户反馈总结出潜在的功能需求,为产品迭代提供方向。a.内容描述核心功能定位:该工具专为Apple Si…

计算语言学家在科技行业的职业发展指南

本文由某中心高级应用科学家分享计算语言学家在科技行业的职业发展建议,涵盖实习机会、研究方向选择、学术与产业研究差异以及非计算背景语言学家的就业路径等实用指导。计算语言学家能在科技行业找到归属吗? 某中心…

新奇特:神经网络的集团作战思维,权重共享层的智慧 - 指南

新奇特:神经网络的集团作战思维,权重共享层的智慧 - 指南pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consol…

2025防水篷布优质厂家推荐:成硕达塑业多功能产品覆盖多领域!

2025防水篷布优质厂家推荐:成硕达塑业多功能产品覆盖多领域!随着科技的不断进步和市场需求的多样化,多功能防水篷布在各个领域的应用越来越广泛。从聚乙烯帐篷到汽车篷布,从宴会用篷布到农林用盖草布,再到泳池布和…

读《数学之美》有感

读《数学之美》有感之前听算法郑老师推荐《数学之美》时,还以为会是本满是公式的难读书,实际翻开才发现完全不一样。 书里没讲复杂的推导,反而从我们每天用的搜索引擎、语音识别说起,把这些功能背后的数学逻辑拆解…

近期应急响应靶场总结

近期应急响应靶场总结 1、黑客webshell里面的flag 一般来说webshell里面的木马有php相关的eval执行代码我们可以以这个为契机,直接进行搜索,不同语言的执行函数不大一样 find ./ type f -name "*.jsp" | x…

Atcoder Beginner Contest 428 补题记录 - Inversentropir

C. Brackets Stack Query 题目大意 给予你 1 个空的字符串与 \(q\) 个询问,形如 1 ( 的询问将在字符串后增加 1 个 ( 字符,形如 2 的询问将会移除最后 1 个字符。在每次询问之后,你需要回答当前字符串中的左右括号是…

【URP】Unity中Mipmap是如何实现的?

《Unity URP中的MipMap技术解析》摘要:本文详解Unity URP管线中的MipMap多级渐远纹理技术,通过预生成分辨率递减的纹理金字塔(如256256→128128→...→11),根据物体距离动态选择纹理层级。重点阐述:1)硬件自动生…

2025彩钢制品优质厂家推荐:腾越彩钢,一站式钢结构解决方案!

2025彩钢制品优质厂家推荐:腾越彩钢,一站式钢结构解决方案!随着建筑行业的不断发展,彩钢瓦、镀锌板、折弯件、C型钢、Z型钢、压型瓦、楼承板、钢结构安装及次檩条等产品在各类工程项目中的应用越来越广泛。然而,这…

SQL中BOM递归查询语句

向下递归查询 WITH CTE AS ( -- 锚点:LT-W-00000001 SELECT bom_no,prd_no,zc_no,id_no,0 AS Level -- 层级:0 表示起始 FROM tf_bom WHERE bom_no = LT-W-00000001-> UNION ALL -- 递归:查找下…

ICCV 2025 (Highlight) Being-VL:师夷长技,用NLP的BPE算法统一视觉语言模型 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …