分享好友 最新动态首页 最新动态分类 切换频道
世界模型来了?OpenAI发布文生视频Sora爆炸出圈
2024-12-25 15:45

公众号:算法一只狗

春节准备过完,OpenAI发布了震撼科技圈的文生视频模型Sora。它出圈的地方就在于,能够把原来生成的几秒视频硬生生拔高到可以生成1分钟左右的视频。

不仅如此,各种媒体还称其为”世界模型“,因为它能够模拟复杂场景,生成符合人类感官的视频。比如下面这个例子:

在东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。

从多个大V的观点来看,这次OpenAI发布的Sora,是一个基于虚幻引擎5做驱动的模型。就连OpenAI官网中,也把Sora称为是构建通向物理世界模拟器的希望路径。

那么,Sora到底有什么惊人的地方,值得大众趋之若鹜?这就先要谈谈之前的文生视频模型的局限性。

我们都知道,在上一年的年末,各种文本视频生成模型突然爆火,让AI技术在文生视频领域也有了一定的用武之地。感兴趣的可以回看我之前详细介绍的文章:

像之前大众所熟知的Runway、Pika软件,由于其简单上手,迅速火遍朋友圈,连我周围很多朋友都尝试过这些好玩有趣的AI视频生成软件。

但是这些软件缺点也很明显,集中在以下几个难以解决的问题

人脸细节生成效果差,在于AI模型往往会聚焦于整体的图片风格生成,而忽略了各种面部细节。

生成的视频存在闪烁问题,这个主要是因为目前的大部分文生视频模型其实是通过多张图片生成后,在进行合并生成视频的。因此它难以保证每一张图片都符合上下文。

同时,以前的文生视频模型或软件,往往只能生成几秒的视频,这是因为长视频的生成往往容易导致画面不连贯,同时时间过长会耗费大量的算力。因此以前的模型最长只有10几秒的视频。

但是OpenAI发布的Sora模型,从其demo来看,已经克服了上面几个比较突出的问题,因此其优点有以下几个:

狗戴着贝雷帽、穿着黑色高领毛衣

一位戴着尖顶帽,身披绣有白色星星的蓝色长袍的巫师正在施法,他的一只手射出闪电,另一只手中拿着一本旧书。

新春舞龙

世界模型最开始是由图灵奖得主LeCun提出来的。他认为真正的世界模型,是AI能够通过感知外部环境,来理解世界的运作方式。

而这种模型需要会听、会读、会写,同时利用自己先验知识来推理,可以跳脱出本身的训练数据。

回到OpenAI发布的Sora,他已经足够惊艳,在基于Transformers架构下生成出的视频已经能够达到以假乱真。并且可以大量的训练数据,去描述现实世界的物理规律。

比如下图中,Sora生成的怪物毛发特性已经很精细了

但是Sora并不完美,他在设计到复杂场景的时候,还是会出现明显的偏差。并没有真正的学习到现实世界的通用规律。比如,在吃掉一个饼干后,Sora也不能够生成吃掉一口的饼干形状。

从目前来看,Sora距离真正的世界模型还是有一定的距离,但是不妨碍其是一个出色的文生视频模型。要想真正实现通用化的AI模型,需要统一多种模态,来理解世界规律。这样才能真正做到不依赖于训练数据,实现自主推理。

最新文章
AI美女写真生成:体验最强的AI画图工具,轻松创造你的虚拟女友!
限时免费,点击体验最近超火的AI生图神器,坐拥3000美女的大男主就是你! https://ai.sohu.com/pc/generate/textToImg?_trans_=030001_yljdaimn 在过去的几年里,AI技术如潮水般涌来,改变了我们生活的方方面面。在这其中,AI生成图像的能
360借条可以协商延期还款吗
小编导语随着互联网金融的发展,越来越多的人选择通过网络平台进行借贷。360借条作为其中的一款借贷产品,因其便捷性和高效性受到了许多用户的青睐。在借款过程中,有些用户可能会因为各种原因面临还款困难,进而产生对延期还款的需求。那
58同城怎么投递简历
58同城是一个非常受欢迎的招聘平台,为求职者和雇主提供了很多便利。如果你想投递简历,以下是一些简单的步骤:1. 注册账号:首先,在58同城官网上注册一个账号。点击“免费注册”按钮,填写所需信息并创建个人账户。2. 完善个人资料:登录
2024新能源汽车冬测续航达成率排行公布:深蓝S05低温区续航里程排行
2024年底,汽车之家启动了《新能源超测》的冬季测试,这是一场覆盖了众多热门新能源车型的实测活动。测试分两个温区:京津冀地区的低温区,平均气温为10°C;以及呼伦贝尔地区的寒冷区,平均气温为-15°C。通过对比这两个温区的实测数据,
21-Hive运算符&函数
整体上,Hive 支持的运算符可以分为三大类:关系运算、算术运算、逻辑运算。官方参考文档:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF也可以使用下述方式查看运算符的使用方式:从 Hive 0.13.0 开始,selec
ASS格式转SRT要怎么转?保姆级教程:手把手教你ass字幕怎么改成srt
ASS格式转SRT要怎么转?在视频制作和观看过程中,字幕文件是不可或缺的一部分。然而,不同的视频播放器或编辑软件对字幕格式的支持程度各不相同。ASS(Advanced SubStation Alpha)和SRT(SubRip Subtitle)是两种常见的字幕格式,其中SRT
2000元左右拍照最好的手机
双十一少不了买手机,可能大家都会纠结到底怎么买才最合适。一加10pro 用了半年,一加ACE Pro在手也用了两个月了;一个主力机,一个备用机。两者使用体验上其实区别不大,现在三五千的手机都是性能过剩,玩大型游戏各种没问题,视频和聊天
2018世界人工智能大会 马云马化腾李彦宏雷军这样解读AI
9月17日,世界人工智能大会于上海开幕。随着人工智能加快普及各行各业,产业变革进入“AI化”前夜,此次世界人工智能大会以“人工智能赋能新时代”为主题,汇集一批在全球人工智能领域最具影响力的科学家和企业家。搜狐科技/马文玥其中,BA
2024新奥天天彩免费资料|最新答案解释落实
  随着数字化时代的到来,信息的获取变得越来越便捷。在这样的背景下,“2024新奥天天彩”这一概念逐渐成为人们关注的焦点,它不仅代表着一种新型的信息交流方式,还寓含着对智慧生活的向往。本文旨在探讨如何合理利用这些免费资料,并对
AI大航海自动写作神器大揭秘
以前我写文章总是要花费大量时间,灵感枯竭时常让我感到无助。每次坐在电脑前,面对空白的文档,我的心情就像一杯未加糖的咖啡,苦涩又无味。然而,自从我使用了颜Sir研发的AI自动写作神器,这一切都变得不一样了!现在,我只需泡一杯咖啡
相关文章
推荐文章
发表评论
0评