MCP实战:在扣子空间用扣子工作流MCP,一句话生成儿童故事rap视频

扣子最近迎来重要更新,支持将扣子工作流一键发布成MCP,在扣子空间里使用。

图片

这个功能非常有用,因为我有很多业务工作流是在扣子平台上做的,两者打通之后,就可以在扣子空间里直接通过对话方式调用扣子工作流了,体验会更加丝滑。

这次我是想将一个儿童故事绘本的工作流发布成MCP,在扣子空间里使用,最终效果就是通过一句话就能生成一个有背景音乐,有人声朗读的儿童故事绘本视频。

在尝试过程中,发现扣子空间的能力和Manus相比还有进步空间,毕竟现在还是beta版本,进展并不如想象中顺利。

最终生成的是一个rap版本的故事绘本视频(至于为什么会做成rap版本,我这里先卖个关子,后面会有解释),这是其中一段:

武松打虎rap视频-b546a90b27

下面详细介绍我的制作过程,其中有不少技巧(坑),也算是摸索了一下当前扣子空间的能力边界。

测试视频生成能力

在正式进行之前,我先做了一个验证测试,确认扣子空间是否有生成视频的能力。

我上传了一张火车票的图片,让扣子空间生成一段音乐,和图片一起合成一段视频。

可以看到扣子空间自己安装了ffmpeg,这个是用来生成视频的软件

图片

Tips: 在我多次尝试过程中,发现并不是每次扣子空间都可以成功安装ffmpeg,如果没有安装成功,可以这样输入指令:

用这个命令安装ffmpeg:apt-get update && apt-get install -y ffmpeg

这样基本上就都能安装成功了。

接下来遇到另外一个坑,生成的视频大小为0,无法播放,经过反复试错,发现可能是因为视频时长过长。

于是修改指令指定生成一段15s长的音乐:

生成15s的舒缓音乐,和附件的图片一起生成一段mp4格式的视频,视频长宽都是720

果然,这样就可以生成有效的视频了,如下:

video3

Tips: 现在扣子空间到底能支持多长的视频生成,我还没有测试过边界,我现在生成过的最长视频是30s

好了,经过以上测试,算是验证了扣子空间生成视频的能力。

可以进行下一步了:将儿童故事绘本工作流引入扣子空间使用

这个过程分为两步:

  1. 将扣子工作流发布成扣子空间的MCP扩展

  2. 在扣子空间中使用这个MCP扩展进行视频创作

下面详细说明如何操作。

发布扣子工作流MCP扩展

说明一下,目前扣子平台只支持将扣子应用发布成MCP(据称后面马上会支持直接将工作流发布成MCP),所以这里我们要多走一步,先创建一个扣子应用。

创建扣子应用

图片

然后将工作流加入应用,界面部分不用管,添加了工作流就可以直接发布成MCP了。

图片

儿童故事绘本的工作流如下,因为这篇文章重点不是介绍扣子工作流,就不展开介绍了,有需要的朋友可以给我留言。

图片

发布成MCP服务

点击右上角的发布进入发布界面以后可以看到,在最右侧有一个MCP服务的选项,点击它就会跳到底部MCP服务那里

图片

这里需要先配置一下,点开配置,勾选全部即可

图片

发布完成

图片

发布完成后,就可以在扣子空间使用了。

扣子空间生成故事视频

按以下步骤操作:

添加扩展

在扣子空间的自定义扩展里可以看到我们刚在扣子平台里发布的这个MCP服务:儿童故事绘本,点击添加。

图片

然后再添加另外两个扣子空间自带的MCP扩展:语音合成(用于生成朗读音频)和音乐生成(用于生成背景音乐),一共3个扩展,如下:

图片

输入指令

这个是我尝试了很多次,才找到的可以成功生成视频的提示词。

图片

相比 Manus 扣子空间的大模型能力还不够强大,遇到问题不太会自己处理,有时候反而需要我给它指令来帮助它解决问题。

比如这里的坑主要是在图片处理上,需要告诉扣子空间将图片下载到本地,否则后面合成视频的时候,无法正确提取到图片。

我之前也测了不少Manus的案例,如果是Manus,这种问题它应该会自己搞定。

终于,视频成功生成了

图片

但是还有个问题,生成的背景音乐,无论我怎么修改提示词(试了差不多十遍),它始终会有人声,无法生成纯音乐,这个就很无语了,效果是这样滴:

武松打虎绘本视频-1bd6b01b1f

所以我最后只能选择不要朗读音频或者不要背景音乐。

然鹅,我突然灵机一动,如果把故事内容作为音乐的歌词呢?这不就完美解决了朗读和音乐结合的问题嘛,而且还颇有新意,于是开头的那个rap视频就是这么来的~~

当然还是期待将来会有支持生成纯音乐的扩展。

写在最后

这算是一次有趣的尝试,对扣子空间当前的能力做了一次探索。虽然说不算完美,但是整个流程是跑通的,这个非常重要。

扣子空间有自己的平台优势,因为它有扣子平台巨量的用户和工作流,这两者打通以后,会产生巨大的化学反应。

扣子空间现在还在beta版本,不能苛求它多完美,但是未来绝对可期。

比如,将来如果把图生视频的MCP接入进来,那么在现在这个demo基础上,我就可以通过一句话做出有动画效果的故事视频了,想想都非常期待~~

更多精彩内容推荐:

-> AI智能体学习&实战

-> 私域AI机器人

-> 自媒体AIP打造

-> AI应用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/83649.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis学习打卡-Day3-分布式ID生成策略、分布式锁

分布式 ID 当单机 MySQL 已经无法支撑系统的数据量时,就需要进行分库分表(推荐 Sharding-JDBC)。在分库之后, 数据遍布在不同服务器上的数据库,数据库的自增主键已经没办法满足生成的主键全局唯一了。这个时候就需要生…

LabVIEW光谱信号仿真与数据处理

在光谱分析领域,LabVIEW 凭借其图形化编程、丰富函数库及强大数据处理能力,成为高效工具。本案例将介绍如何利用 LabVIEW 仿真光谱信号,并对实际采集的光谱数据进行处理,涵盖信号生成、数据采集、滤波、分析及显示等环节。 ​ 一…

nginx相关面试题30道

一、基础概念与核心特性 1. 什么是 Nginx?它的主要用途有哪些? 答案: Nginx 是一款高性能的开源 Web 服务器、反向代理服务器及负载均衡器,基于事件驱动的异步非阻塞架构,擅长处理高并发场景。 主要用途:…

数据库实验报告 数据定义操作 3

实验报告(第3次) 实验名称 数据定义操作 实验时间 10月12日1-2节 一、实验内容 1、本次实验是用sql语句创建库和表,语句是固定的,要求熟记这些sql语句。 二、源程序及主…

霍夫圆变换全面解析(OpenCV)

文章目录 一、霍夫圆变换基础1.1 霍夫圆变换概述1.2 圆的数学表达与参数化 二、霍夫圆变换算法实现2.1 标准霍夫圆变换算法流程2.2 参数空间的表示与优化 三、关键参数解析3.1 OpenCV中的HoughCircles参数3.2 参数调优策略 四、Python与OpenCV实现参考4.1 基本实现代码4.2 改进…

记录一次修改nacos安全问题导致服务调用出现404

1、nacos默认值修改 nacos.core.auth.plugin.nacos.token.secret.key**** nacos.core.auth.server.identity.key******** nacos.core.auth.server.identity.value************ 重启nacos, 这时候微服务的token认证会立即失效,等待自动重连认证或者手动重启服务 2、…

Python面试总结

hello,大家好,我是potato,我总结一下最近的面试遇到的问题~ 1.Python开发(软通动力) 自我介绍主要问了项目(YOLOv11)项目遇到的难点和解决方法is,列表和元组的区别Python多线程有什么问题?Pyt…

5.18 day24

知识点回顾: 元组可迭代对象os模块 作业:对自己电脑的不同文件夹利用今天学到的知识操作下,理解下os路径。 元组 元组的特点: 有序,可以重复,这一点和列表一样 元组中的元素不能修改,这一点…

Uniapp中小程序调用腾讯地图(获取定位地址)

1、先配置权限: 这是上图的代码: "permission": { "scope.userLocation": { "desc": "你的位置信息将用于小程序位置接口的效果展示" } } 第二步:写代码: //下面是uniapp的模版代码 主…

写spark程序数据计算( 数据库的计算,求和,汇总之类的)连接mysql数据库,写入计算结果

1. 添加依赖 在项目的 pom.xml&#xff08;Maven&#xff09;中添加以下依赖&#xff1a; xml <!-- Spark SQL --> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-sql_2.12</artifactId> <version>3.3.0…

nginx服务器实验

1.实验要求 1&#xff09;在Nginx服务器上搭建LNMP服务&#xff0c;并且能够对外提供Discuz论坛服务。 在Web1、Web2服务器上搭建Tomcat 服务。 2&#xff09;为nginx服务配置虚拟主机&#xff0c;新增两个域名 www.kgc.com 和 www.benet.com&#xff0c;使用http://www.kgc.…

Spring Boot 与 RabbitMQ 的深度集成实践(一)

引言 ** 在当今的分布式系统架构中&#xff0c;随着业务复杂度的不断提升以及系统规模的持续扩张&#xff0c;如何实现系统组件之间高效、可靠的通信成为了关键问题。消息队列作为一种重要的中间件技术&#xff0c;应运而生并发挥着举足轻重的作用。 消息队列的核心价值在于其…

c++多线程debug

debug demo 命令行查看 ps -eLf|grep cam_det //查看当前运行的轻量级进程 ps -aux | grep 执行文件 //查看当前运行的进程 ps -aL | grep 执行文件 //查看当前运行的轻量级进程 pstree -p 主线程ID //查看主线程和新线程的关系 查看线程栈结构 pstack 线程ID 步骤&…

10.7 LangChain v0.3架构大升级:模块化设计+多阶段混合检索,开发效率飙升3倍!

LangChain v0.3 技术生态与未来发展 关键词:LangChain Chains, Agents 架构, Retrieval Strategy, LangGraph, 模块化设计 3. LangChain 项目:Chains, Agents, Retrieval Strategy LangChain v0.3 通过 Chains-Agents-Retrieval 三位一体的技术栈,构建起完整的大模型应用开…

分布式 ID 生成的五种方法:优缺点与适用场景

0.简介 在分布式系统中&#xff0c;生成全局唯一的id是一个常见的需求。由于分布式系统的特性&#xff08;多节点&#xff0c;网络分区&#xff0c;时钟不同步等&#xff09;&#xff0c;传统的单机ID生成方式不再适用&#xff0c;所以一些分布式生成方式应运而生&#xff0c;…

基于单片机路灯自动控制仪仿真设计

标题:基于单片机路灯自动控制仪仿真设计 内容:1.摘要 本设计旨在解决传统路灯控制方式效率低、能耗大的问题&#xff0c;开展了基于单片机的路灯自动控制仪仿真设计。采用单片机作为核心控制单元&#xff0c;结合光照传感器、时钟模块等硬件&#xff0c;运用相关软件进行编程和…

计算机网络-MPLS VPN基础概念

前面几篇文章我们学习了MPLS的标签转发原理&#xff0c;有静态标签分发和LDP动态标签协议&#xff0c;可以实现LSR设备基于标签实现数据高效转发。现在开始学习MPLS在企业实际应用的场景-MPLS VPN。 一、MPLS VPN概念 MPLS&#xff08;多协议标签交换&#xff09;位于TCP/IP协…

LWIP的Socket接口

Socket接口简介 类似于文件操作的一种网络连接接口&#xff0c;通常将其称之为“套接字”。lwIP的Socket接口兼容BSD Socket接口&#xff0c;但只实现完整Socket的部分功能 netconn是对RAW的封装 Socket是对netconn的封装 SOCKET结构体 struct sockaddr { u8_t sa_len; /* 长…

windows 安装gdal实现png转tif,以及栅格拼接

windows 安装gdal实现png转tif&#xff0c;以及栅格拼接 一、安装gdal 网上有很多安装gdal的方法&#xff0c;此处通过osgeo4w安装gdal 1.下载osgeo4w 下载地址 https://trac.osgeo.org/osgeo4w/ 2、安装osgeo4w exe文件安装&#xff0c;前面部分很简单&#xff0c;就不再…

Node.js 源码概览

Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行时环境&#xff0c;它的源码结构相当庞大且复杂。下面我将为你讲解 Node.js 源码的主要结构和关键组成部分。 源码结构 Node.js 的主要源码目录结构如下&#xff1a; node/ ├── lib/ # JavaScript 核心模…