《AI生成式工具使用》之:AI文本生视频(二战!)

目录

背景说明及目标

尝试练手

1、豆包AI之图片生成

        总结:豆包AI生成的图片,不太能看细节,涉及到中文的基本上不能细看都是类似乱码的东西,有明显的逻辑性问题(比如不符合道路交规)。需要根据生成的结果不断地调整关键词,存在着太多的不确定性。

2、用即梦AI生成图片

        总结:相比豆包AI,即梦AI生成的图片没有明显的逻辑性错误,更有氛围感,对于成语和动词更具有理解性,且能表现出来。存在相同的问题:涉及到中文都是乱码,存在细节问题。

3、用可灵AI生成图片

        总结:可灵AI生成的图片氛围感不错,相比即梦AI貌似可灵AI没能理解"拥挤",更多的体现了"清晨"的氛围。存在相同的问题:涉及到中文都是乱码,另外其实中国全红色涂装的急救车很少见。不确定它这个是跟消防车弄混了,还是学习的数据来源有偏差。

4、用即梦AI尝试图片生视频和文案生视频

       1)即梦AI图片生视频

        总结:不能看细节,物体的运动状态也不太写实。一旦动起来之后就会出现一些逻辑性问题。

         2)即梦AI文本生视频

        结论:即梦AI生成视频依旧有中文乱码、细节性问题,逻辑性问题会很随机的出现,也就是不确定性很大。

5、用可灵AI尝试图片生视频和文案生视频

       1)可灵AI图片生视频

         2)可灵AI文本生视频

总结

关注我,躺不平就一起卷吧


背景说明及目标

        想在抖音上创建账号,主要用于日常读书分享。抖音流量大,因为是视频平台,所以需要制作视频。因本人从没有过这方面的经验,所以思考是否可以考虑借助外部工具。       

        背景:想运营一个抖音的读书账号:斯斯讲书。第一本要分享的书名叫《急救比医生快一步》

        目标:做一个预告视频,预告一下,希望能吸引关注。以预告做一个入门练习,熟悉了后面的所有分享就可以用AI生成视频,而我只需要专注于读书分享的文案就可以。

        上一篇“《AI生成式工具使用》之:自助生成视频”完全没摸着AI生成视频或者AI生成图片的边儿,导致生成的“玩意儿”一言难尽。重新做了梳理,决定二战AI文本生视频!

        学习中的小总结:AI写作、AI画图、AI生成视频对于非这类工作的人其实还是有门槛的,并不是有了AI工具,所有人都能通过AI工具去替代写文案的、画图的、做视频的。本质上还是需要有工作能力和创作思维。有工作能力+创作思维+AI能提高工作效率,事半功倍。有创作思维+AI可以一定程度上实现跨界。但是很不幸,在写作、画图、视频这块完全门外汉的我,显然是既没有相关的工作能力,又没有创作思维,手上拿个AI也是个棒槌。

        不过一生要强的中国女人,为了省钱,就是得一人身兼多职,AI文本生视频怎么滴都得拿下,也就只能蹒跚学步了。毕竟AI这股潮流,谁都得赶一赶。

尝试练手

        想象中的预告片描述:

        远景:拥挤繁忙的早高峰,街头热闹而拥挤。刺耳且紧迫的120急救车的鸣笛声穿透出来,由远及近,再匆匆驶离

        中景:医院的急救大厅,医生护士匆忙的进行着抢救,家属慌乱的呼唤着病人的名字

        近景:逆光的太平间的大门

1、豆包AI之图片生成

  • 下载豆包App,可通过抖音绑定注册登录
  • 登陆后进入主界面,选择下方"图片生成"

  • 在图片生成页面,比例选择9:16(手机竖屏显示),点击”+添加特征词“
  • 镜头视角:全景;光线:自然光;风景:城市景观;人像:无,点击"添加"
  • 继续补充输入"拥挤繁忙的早高峰,街头喧闹拥挤,急速行驶的120急救车",点击发送按钮,生成图片如下:

        (问题:地点没有在中国,生成的人物和地点都是外国,车上的标语都是英语。人都是随便的散在了机动车道。仔细看细节异常奇怪,有人头是反的,缺胳膊少腿儿的。)

  • 重新生成,修改特征词如下:“全景、自然光、城市景观、北京繁忙的早高峰,街头喧闹拥挤,急速行驶的120急救车”,点击发送按钮,生成图片如下:

        (问题:依旧是行人在机动车道上乱窜,没有交规。如果不看细节倒也还能接受。)

  • 重新生成:“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。比例9:16”,生成图片如下:

        总结:豆包AI生成的图片,不太能看细节,涉及到中文的基本上不能细看都是类似乱码的东西,有明显的逻辑性问题(比如不符合道路交规)。需要根据生成的结果不断地调整关键词,存在着太多的不确定性。

2、用即梦AI生成图片

  • 采用与上面相同的内容,“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。”。生成图片如下:

        总结:相比豆包AI,即梦AI生成的图片没有明显的逻辑性错误,更有氛围感,对于成语和动词更具有理解性,且能表现出来。存在相同的问题:涉及到中文都是乱码,存在细节问题。

3、用可灵AI生成图片

  • 采用与上面相同的内容,“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。”。生成图片如下:

 

        总结:可灵AI生成的图片氛围感不错,相比即梦AI貌似可灵AI没能理解"拥挤",更多的体现了"清晨"的氛围。存在相同的问题:涉及到中文都是乱码,另外其实中国全红色涂装的急救车很少见。不确定它这个是跟消防车弄混了,还是学习的数据来源有偏差。

4、用即梦AI尝试图片生视频和文案生视频

       1)即梦AI图片生视频

  • 用即梦AI图片生视频,选用之前AI生成的图片,填写文案如下“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,随机运镜、慢速、标准模式、3s,生成视频如下:

        (问题:生成图片时没有细看,现在图片生视频,图片上的车动起来之后发现了逻辑错误的地方,急救车逆向行驶了!!!!)

        (问题:车的行驶状态飘忽,总有正在发生车祸的感觉。远处出莫名其妙的飘出来了鬼东西!!!)

        总结:不能看细节,物体的运动状态也不太写实。一旦动起来之后就会出现一些逻辑性问题。

         2)即梦AI文本生视频

  • 填写文案“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,随机运镜,慢速,3s,9:16,生成视频如下:

         (问题:中文乱码,出现了警车。给出的是清晨,画面太暗了。调整文本重新再试一下)

  • 调整文案“北京繁忙的上午,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶,不要出现警车”,随机运镜,慢速,3s,9:16,生成视频如下:

        (问题:改成上午了,还是没有很亮的感觉。另外!!!!MD!!!真的吓人,边上出鬼东西了!!!!!)

        结论:即梦AI生成视频依旧有中文乱码、细节性问题,逻辑性问题会很随机的出现,也就是不确定性很大。

5、用可灵AI尝试图片生视频和文案生视频

       1)可灵AI图片生视频

  • 用即梦AI图片生视频,选用之前AI生成的图片,填写文案如下“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,实际上等了近3个小时均未能生成成功。

         2)可灵AI文本生视频

  • 文案输入“北京繁忙的上午,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,生成视频如下(忘记选9:16了,但不影响其生成的内容):

        (问题:一言难尽,一台晃晃悠悠的老头乐??边上出现的诡异车..)

总结

        AI生成视频还是比较适合创意性的、虚拟的、非真实的应用场景。对于写实一点或者细节很多的场景,逻辑问题会很随机的出现,输出的结果不确定性很大!另外,出现中文的地方都是乱码!!!问题蛮大的。

        像我的实际需求可能更偏向于真实存在的场景,因此对我来说可能更好的选择是选用现成的视频模板进行替换、剪辑。

        另外还有个AI Mate App,可以直接输入文案(可以是故事),然后生成视频。因为没有试用功能,直接就需要充钱使用,风险蛮大的,暂时未测试。

        即梦AI也有类似AI Mate的故事创作功能,但需要充值VIP,暂时未测试。

        依旧没有完成目标,没能按照需求生成想要的视频。但至少验证了,我的需求没办法通过AI完全满足。得学习基础剪辑,或者试试AI剪辑功能。        

关注我,躺不平就一起卷吧

        顺便厚颜的打个广告,♥关注我♥,发布的文章专辑涉及到嵌入式开发、AI知识、日常调试bug记录、AI工具使用记录等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/57136.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

超越 React Query:探索更高效的数据请求策略

你好,开发者们! 在前端开发的海洋中,我们常常遇到组件间通信的难题。你是否也曾为如何优雅地在组件间传递信息而头疼?今天,我想和大家分享一个让我眼前一亮的解决方案——使用 alova。 跨组件触发请求的挑战 想象一…

Java-继承与多态-上篇

关于类与对象&#xff0c;内容较多&#xff0c;我们分为两篇进行讲解&#xff1a; &#x1f4da; Java-继承与多态-上篇&#xff1a;———— <就是本篇> &#x1f4d5; 继承的概念与使用 &#x1f4d5; 父类成员访问 &#x1f4d5; super关键字 &#x1f4d5; supe…

Windows设置程序开机自启动的几种方法

1. 使用“启动”文件夹 Windows 有一个专门的“启动”文件夹&#xff0c;所有放在这个文件夹中的程序都会在系统启动时自动运行。 步骤&#xff1a; 按下 Win R&#xff0c;输入 shell:startup&#xff0c;并按下回车。 在弹出的启动文件夹中&#xff0c;将你想要开机自启动…

laravel 查询数据库

数据库准备 插入 三行 不同的数据 自行搭建 laravel 工程 参考 工程创建点击此处 laravel 配置 数据库信息 DB_CONNECTIONmysql #连接什么数据库 DB_HOST127.0.0.1 # 连接 哪个电脑的 ip &#xff08;决定 电脑 本机&#xff09; DB_PORT3306 # 端口 DB_DATABASEyanyu…

PostgreSQL模板数据库template0和template1的异同点

PostgreSQL模板数据库 PostgreSQL有两个模板数据库&#xff1a;template0和template1&#xff0c;template0是不可修改的&#xff0c;而template1是可以修改的。 那模板数据库有什么作用呢&#xff1f;顾名思义&#xff0c;当做模板。 其实我们创建数据库 CREATE DATABASE 其…

【记录】VSCode|自用设置项

文章目录 1 基础配置1.1 自动保存1.2 编辑区自动换行1.3 选项卡换行1.4 空格代替制表符1.5 开启滚轮缩放 2 进阶设置2.1 选项卡不自我覆盖2.2 选项卡限制宽度2.3 选项卡组限制高度2.4 字体设置2.5 字体加粗2.6 侧边栏2.7 沉浸式代码模式 Zen Mode2.8 设置 Zen 模式的选项卡组 3…

filebeat接入nginx和mysql获取日志

下载nginx &#xff08;1&#xff09; 直接下载 yum install nginx -y&#xff08;2&#xff09;查看状态启动 systemctl start nginx systemctl status nginx&#xff08;3&#xff09;配置文件检查 nginx -t&#xff08;4&#xff09;端口检查 netstat -tulpn | grep :80&am…

Flutter项目打包ios, Xcode 发布报错 Module‘flutter barcode_scanner‘not found

报错图片 背景 flutter 开发的 apple app 需要发布新版本&#xff0c;但是最后一哆嗦碰到个报错&#xff0c;这个小问题卡住了我一天&#xff0c;之间的埪就不说了&#xff0c;直接说我是怎么解决的&#xff0c;满满干货 思路 这个报错 涉及到 flutter_barcode_scanner; 所…

携手并进,智驭教育!和鲸科技与智谱 AI 签署“101 数智领航计划”战略合作协议

近日&#xff0c;上海和今信息科技有限公司&#xff08;以下简称“和鲸科技”&#xff09;与北京智谱华章科技有限公司&#xff08;以下简称“智谱 AI”&#xff09;签署“101 数智领航计划”战略合作协议。双方将携手营造智能化学科教育与科研环境&#xff0c;提供多种大模型工…

前后端联调需要改ip联调多个后端,用nginx代理

前后端联调需要改ip联调多个后端 Nginx #user nobody; worker_processes 1;#error_log logs/error.log; #error_log logs/error.log notice; #error_log logs/error.log info;#pid logs/nginx.pid;events {worker_connections 1024; }http {include mime…

空洞卷积:Atrous/Dilated convolution - 语义分割中多用到

没办法&#xff0c;我还是很多基础的、底层的模块不通透&#xff0c;读论文难免会受到阻碍&#xff0c;而且这现在科研任务很急了&#xff0c;必须要马上动手实验&#xff0c;全给我弄明白、特别是算法&#xff01; 空洞卷积-可变形卷积-这一个个我都要。 空洞卷积据说在语义分…

C#WPF基本概念

一、什么是WPF&#xff1f; C# WPF&#xff0c;即Windows Presentation Foundation&#xff0c;是一个用于构建Windows桌面应用程序的UI框架。WPF支持广泛的应用程序开发功能&#xff0c;包括应用模型、资源、控件、图形、布局、数据绑定、文档和安全性。它是.NET Framework的…

MySQL企业常见架构与调优经验分享

文章目录 一、选择 PerconaServer、MariaDB 还是 MYSQL二、常用的 MYSQL 调优策略三、MYSOL 常见的应用架构分享四、MYSOL 经典应用架构 观看学习课程的笔记&#xff0c;分享于此~ 课程&#xff1a;MySQL企业常见架构与调优经验分享 mysql官方优化文档 一、选择 PerconaServer、…

TypeScript基础总结

一、TS 基础类型 &#xff08;1&#xff09;JavaScript 中的数据类型: string 字符串 number 数值 boolean 布尔 null 空 undefined 未定义 bigint 整数数据类型 symbol symbol 原…

机器学习与深度学习2:梯度下降算法和BP反向传播算法

梯度下降算法&#xff1a; 算法原理 上一章我们已知神经网络算法就是求解拟合函数&#xff0c;通过线性变换和非线性变换来得出损失函数最小的模型。那么是如何进行求解的呢&#xff0c;其中之一就是梯度下降算法。 如图&#xff0c;当我们需要求解拟合曲线时&#xff0c;如何…

[计算机网络] 常见端口号

前言 ​ 常见的端口号是指互联网协议&#xff08;如TCP/IP&#xff09;中预留给特定服务使用的数字范围。它们主要用于标识网络应用程序和服务&#xff0c;并帮助数据包在网络中找到正确的接收方。 按协议类型划分 TCP协议端口&#xff1a; 21&#xff1a;FTP文件传输协议2…

Verilog基础:层次化标识符的使用

相关阅读 Verilog基础https://blog.csdn.net/weixin_45791458/category_12263729.html?spm1001.2014.3001.5482 一、前言 Verilog HDL中的标识符(identifier)是一个为了引用而给一个Verilog对象起的名字&#xff0c;分为两大类&#xff1a;普通标识符大类和层次化标识符大类。…

H3C路由器交换机操作系统介绍

路由器 路由器的作用 连接具有不同介质的链路连接网络或子网&#xff0c;隔离广播对数据报文执行寻路和转发交换和维护路由信息 H3C 路由器系列 CR系列核心路由器SR系列高端路由器MSR系列路由器ER系列路由器 交换机 交换机的作用 连接多个以太网物理段&#xff0c;隔离冲…

HarmonyOS NEXT 应用开发实战(六、组件导航Navigation使用详解)

在鸿蒙应用开发中&#xff0c;Navigation 组件是实现界面间导航的重要工具。本文将介绍如何使用 Navigation 组件实现页面跳转及参数传递&#xff0c;确保你能轻松构建具有良好用户体验的应用。 当前HarmonyOS支持两套路由机制&#xff08;Navigation和Router&#xff09;&…

字典学习算法

分为固定基字典和学习型字典 学习型字典 是指通过训练大量与目标数据相似的数据&#xff0c;学习其特征获得的字典。字典学习主要包括两个阶段&#xff0c;一个是字典构建阶段&#xff0c;一个是利用字典进行样本表示阶段。 首次提出&#xff1a;最优方向法&#xff08;Method …