OpenAI最新发布的文生视频模型Sora到底强在哪?

文章目录

    • 1.Sora到底强在哪?
    • 2. 不足
    • 3. 结尾

在这里插入图片描述
2024年2月16日,当大家沉浸在过年的喜庆氛围中,OpenAI发布首款文生成视频大模型 Sora ,其炸裂登场让人感到惊艳。

Sora官网介绍:https://openai.com/sora
在这里插入图片描述

说起文生视频工具,比如Runway、Pika,用户输入文字就能得到一段几秒到十几秒的视频内容,但因为效果一般,并未被广泛使用。

1.Sora到底强在哪?

此次Sora能够爆火出圈,实在是因为它过于优秀。同样是用户输入提示文字,Sora生产的视频不仅质量高,场景还很逼真丝滑、细节丰富。

其一,Sora可生成60s超长视频。相较于Runway MLGen-2、Pika等文生视频大模型,Sora可生成一镜到底的逻辑顺畅视频,主人物及背景人物均非常稳定,文生视频大模型能力突出。

其二,Sora多角度视频一致性。Sora可以在单个生成视频中创建多个镜头,以准确保留角色和视觉风格。OpenAI官网发布的Demo视频中,有多角度镜头,且主人物保持了完美的一致性。

其三,Sora在尝试理解物理世界。根据OpenAI官网披露,Sora不仅可以理解用户的描述要求,同时亦尝试理解描述的事物在物理世界中的存在方式(即物理规律)。根据OpenAI官网Demo视频中,汽车在山路行驶中的颠簸等动作符合物理世界规律,视频逼真程度进一步提升。
Sora可以用简单的方式模拟影响世界状态的行为。例如,随着时间的推移画家可以在画布上留下新的笔触,或者一个人吃汉堡时留下咬痕。

其四,图像生成功能。Sora还能生成图像,通过在一个时间范围为一帧的空间网格中排列高斯噪声块来实现这一点。该模型可以生成可变大小的图像,最高可达2048 × 2048分辨率。

其五,模拟数字世界。Sora还能够模拟人工过程,比如视频游戏。Sora可以在高保真度渲染世界及其动态的同时,用基本策略控制《我的世界》中的玩家。

2. 不足

Sora官方也指出自己的模型存在的不足和局限性

它不能准确地模拟许多基本相互作用的物理过程,比如玻璃破碎。

可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。例如,一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。

还会混淆提示的空间细节,例如,左右混淆,并且可能难以精确描述随时间推移发生的事件,例如遵循特定的摄像机轨迹。

3. 结尾

从Runway MLGen-2、Pika到Sora,文生视频大模型频出,视频长度从3~4秒到60秒,模型对物理世界的理解愈加接近现实,已经具备商业化落地价值,创作内容产业革命来临,AIGC新时代已至。

这意味着什么?以后哪怕普通人,只要具有丰富的想象力,能够将脑海里的画面准确地描述出来,那么就能生成相应的画面视频,甚至是独立创作出一部电影。想想都很震撼!!!
在这里插入图片描述

每次技术的革新,总是惊喜与恐惧并存

恐慌无用的话,不如尽力拥抱

”与时俱进“不应该是一句口号,”拥抱变化“也不应该是一句鸡汤

你可以不屠龙,但不能不磨刀。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/708675.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SLA 是什么?如何实现 SLA 管理

随着业务的不断壮大,为了满足日益增长的客户需求,网络必须保持与这些需求同步。同时,为了提高最终用户的体验,运维人员/网络管理员在监控企业级网络时遇到了不少瓶颈,必须不断审查网络,以确保提供的服务质量…

【Python笔记-设计模式】备忘录模式

一、说明 备忘录模式是一种行为设计模式,允许在不暴露对象实现细节的情况下保存和恢复对象之前的状态。 (一) 解决问题 主要解决在不破坏封装性的前提下,捕获一个对象的内部状态,并在对象之外保存这个状态,以便在需要时恢复对象…

c#委托的三种实现方式

委托是实质一个类,主要目的是将方法当作参数进行传递。 委托是.NET编程的精髓之一,在日常编程中经常用到,在C#中实现委托主要有Func、Action、delegate三种方式,本节主要就这三种委托的用法通过实例展开讲解。 Func用法解析 【F…

log4j 基础使用入门教程

一、Log4j介绍 在项目中,不管是开发人员写代码还是测试人员写的测试代码一般都需要做一些日志来记录项目的行为,以便更好的跟踪项目中的一些交互和问题。 Log4j ( Logger For Java ) , Java 日志的记录包。 官方网站 。Log4j 是 Apache 的一个开源项目…

transformers模型预训练

模型预训练是指在深度学习领域中,先在一个大规模数据集上对模型进行初步训练,使模型能够学习到基本的特征表示和模式,然后再针对具体任务或特定数据集进行微调的过程。本次主要介绍掩码语言模型预训练以及因果语言模型预训练。 掩码语言模型预训练是自然语言处理领域中的一…

深入探讨Qt树状显示功能:理论与实践

在当今的软件开发领域,数据的组织和展示方式对于提升用户体验至关重要。树状显示功能作为一种常见的数据展示方式,能够以层次分明的形式展示复杂的数据结构,极大地增强了应用程序的可用性和可理解性。Qt框架作为一种跨平台的C图形用户界面应用…

SRC漏洞挖掘思路手法

这段时间挖掘了挺多的SRC漏洞,虽然都是一些水洞,也没有一些高级的漏洞挖掘利用手法,但是闲下来也算是总结一下,说说我对SRC漏洞挖掘的思路技巧。 很多人可能都挖过很多漏洞其中包括一些EDU或者别的野战,但是对于SRC往…

QQ录屏会录到外界声音吗?这篇文章告诉你答案

在现代网络科技快速发展的今天,屏幕录制已成为人们日常办公、学习、娱乐的重要工具。qq作为国内最受欢迎的社交软件之一,其内置的屏幕录制功能受到很多人的青睐。可是使用的过程中,很多人会有疑问:qq录屏会录到外界声音吗&#xf…

数据结构(C语言版)01

//顺序存储 int main(){ int ans[5]{1,1,1,1,3};//定义并初始化 printf("%d",ans[4]); return 0; } //链式存储 Typdef struct Lnode{ElemType data;struct Lnode *next; }Londe,*LinKlist;Londe *L; L(LinkList)malloc(sizeof(Lnode)); A->nextB;B->nextC;…

Python中re模块的使用

在Python中,处理正则表达式的模块是re模块。通过re模块,可以使用正则表达式来进行字符串的匹配、查找、替换等操作。执行效率特别高,可读性不强。 1.方法 match 从头开始匹配 返回Match 或者None import re r re.match(".\w{10}"…

单片机烧录方式 -- IAP、ISP和ICP

目录 背景 1 什么是ICP 2 什么是ISP 3 什么是IAP 4 总结 背景 对于51单片机,我们使用STC-ISP上位机软件通过串口进行程序的烧写;对于STM32系列单片机,我们既可以通过串口烧写程序,也能通过JLink或是STLink进行程序的烧写&am…

如何保护服务器的安全

互联网的迅速发展,让很多企业都很重视网络技术的使用,但是网络的传播速度比较快,同时容易造成数据、隐私方面的泄露现在每个企业基本有自己的服务器。有几点需要注意,可以参考: 1.基础密码安全 最基本的安全就是密码安…

linux 如何给服务器批量做免密,如何批量挂在磁盘

前提条件 所有机器网络互通,且已做了免密登录 linux服务器批量做免密脚本如下 #!/bin/bash # 定义服务器列表文件 SERVERS_FILE"host" # 定义生成的密钥的存储目录 KEY_DIR"/root/.ssh" # 检查是否输入了文件路径 if [ $# -ne 1 ]; then …

车载电子电器架构 —— 基础技术开发概述

车载电子电器架构 —— 基础技术开发概述 我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗…

.Net Core与存储过程(一)

例子1 C# 调用存储过程 CREATE PROCEDURE [dbo].[spFunc] id BIGINT, isTrue BIT, str NVARCHAR (60), strZh NVARCHAR (60) AS BEGINSELECT *FROM tableAWHERE id idAND isTrue isTrueAND str strAND strZh strZh; ENDlong idLong 18; bool isBoolean true; string …

【element-ui】el-select multiple多选,表单校验问题解决方法

在项目开发过程中发现,el-select设置了multiple支持多选属性之后,el-select赋值之后,表单校验不通过 解决思路及解决方法: 1、首先看看v-model 、prop属性、rules校验是否正确,这里注意el-select的rules校验的trigger…

代码随想录三刷day17

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、力扣144. 二叉树的前序遍历二、力扣145. 二叉树的后序遍历三、力扣94. 二叉树的中序遍历四、力扣144. 二叉树的前序遍历无、力扣145. 二叉树的后序遍历六、…

【Go语言】Go语言中的指针

Go语言中的指针 变量的本质是对一块内存空间的命名,我们可以通过引用变量名来使用这块内存空间存储的值,而指针则是用来指向这些变量值所在内存地址的值。 注:变量值所在内存地址的值不等于该内存地址存储的变量值。 Go语言中,…

42.do...while语句

目录 一.什么是do...while语句 二.语法 三.执行流程图 四.举例 五.视频教程 一.什么是do...while语句 do...while语句也是循环语句,和while语句的区别是,while语句是先判断表达式,如果表达式成立才会执行循环体中的内容,否则…

新书速览|Python数据分析快速上手

从零开始,小白轻松入手,一步一步教你学数据分析,让数据分析变得简单易懂 本书内容 《Python数据分析快速上手》通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python进行数据分析应该掌握的各方面技术。本书内容包括Python基…