通用人工智能(AGI)是指一种,具有与人类智能相当或超过人类智能的广泛能力,能够在各种不同的任务和领域中表现出灵活性、创造力和推理能力。与目前大多数人工智能系统专注于解决特定任务或领域不同,AGI的目标是创造一个能够像人类一样学习、理解和解决各种问题的智能系统。本文主要介绍一下最新的大模型Sora,作为通用人工智能会给我们带来什么感受~
2024年2月15日,OpenAI发布了最新的视频生成模型(Sora),接下来我们进入官网进行看看这一壮举吧(地址放到了文章结尾)
首先我们欣赏一下官方生成的视频
总体来看,相信大家都十分惊讶,但是如果细看一些部分或许发现背景文字人物等,还会判定为AI生成,文章不方便展示,如果看到了原视频的小伙伴可以发现视频里面有视频镜头的切换,这也是AI生成的。
Sora模型可以生成竖屏横屏等各种尺寸
同时它类似stable diffusion的文生图,Sora可以文生视频。标签越精准,关键词越多,效果越好
不光如此,还可以通过静态的图片生成视频
还有就是扩展生成的视频,产生无缝的循环
下面的图展示了Sora 能够零镜头地改变输入视频的风格和环境,这里不禁想到文生图中的改变
连接视频,Sora 在两个输入视频之间逐渐进行插值,从而在具有完全不同主题和场景构成的视频之间创建无缝过渡。在下面的示例中,中心的视频插值在左侧和右侧的相应视频之间。这有点类似视频剪辑哈,但是不知道AI做的是否真的符合大众审美
当然不止上述的内容,下面我将其他的贴出来,供读者自行观看
我们看这里的说明随着算力的提升会对视频质量有显著的影响,做过diffusion模型的会发现损失或许没那么明显的变化,但是产品的质量或许的的确确有所提高
OpenAI强大的算力,以及坚实的大语音模型和丰富的数据集共同带来了Sora大模型