分享好友 最新动态首页 最新动态分类 切换频道
刚刚,OpenAI Sora正式炸裂登场,网页挤爆了!
2024-12-26 10:20

算起来,距离今年 2 月 16 日 Sora 的发布已经过去了近 10 个月的时间。

视频链接:https://mp.weixin.qq.com/s/_cm8Sw50XF0P2JtHGDAKKA?token=1912244716&lang=zh_CN

让你的想象力栩栩如生

那就先为读者们展示下官方放出的 Sora 的能力吧。

Storyboard:在时间线上组织和编辑视频的独特序列

更多 Sora 生成的惊艳视频,也需要广大网友们的想象力去创造了。

Sora 正式版系统卡

在今年 2 月份,Sora 刚发布时,OpenAI 曾公布了 Sora 的技术报告(参阅:我在模拟世界!OpenAI 刚刚公布 Sora 技术细节:是数据驱动物理引擎)。

OpenAI 认为,扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。

Sora 是 OpenAI 的视频生成模型,旨在获取文本、图像和视频输入并生成新视频作为输出。用户可以创建各种格式的高达 1080p 分辨率(最长 20 秒)的视频。

Sora 建立在 DALL・E 和 GPT 模型的基础上,旨在为人们提供创意表达的工具。

Sora 是一种扩散模型,它从看起来像静态噪声的基本视频开始生成新视频,通过多个步骤消除噪声来逐渐对其进行转换。通过一次为模型提供多帧预测,Sora 解决了一个具有挑战性的问题,即确保画面主体即使暂时离开视野也能保持不变。与 GPT 模型类似,Sora 使用 transformer 架构,释放出卓越的扩展性能。

Sora 使用 DALL・E 3 中的重描述(recaptioning)技术,该技术涉及为视觉训练数据生成高度描述性的字幕(captions)。因此,Sora 能够更忠实地遵循生成视频中用户的文本指令。

除了能够仅根据文本指令生成视频之外,该模型还能够获取现有的静态图像并从中生成视频,准确地将图像内容动画化并关注细节。该模型还可以获取现有视频并对其进行扩展或填充缺失帧。Sora 是能够理解和模拟现实世界的模型的基础,OpenAI 认为 Sora 将成为通往 AGI 的重要里程碑。

在数据方面,正如 OpenAI 在 2 月的技术报告中所述,Sora 从大型语言模型中汲取灵感,这些模型通过互联网规模数据的训练来获得通才能力。LLM 得以确立新范式,部分得益于创新了 token 使用的方法。研究人员们巧妙地将文本的多种模态 —— 代码、数学和各种自然语言统一了起来。

在 Sora 中,OpenAI 考虑了生成视觉数据的模型如何继承这种方法的好处。大型语言模型有文本 token,而 Sora 有视觉 patch。此前的研究已经证明 patch 是视觉数据模型的有效表征。OpenAI 发现 patch 是训练生成各种类型视频和图像的模型的可扩展且有效的表征。

在更高层面上,OpenAI 首先将视频压缩到较低维的潜在空间,然后将表征分解为时空 patch,从而将视频转换为 patch。

Sora 接受过各种数据集的训练,包括公开数据、通过合作伙伴获取的专有数据以及内部开发自定义数据集:

更多细节,读者们可以查看系统卡介绍。

价格权益

最新文章
男生女生向前冲第16季之1米八女老师来闯关 男大一骑绝尘成功登顶高能片段
{{if !data.isVip && data.isActText}}{{else if !data.isVip && !data.isActText}}{{else}}{{if !data.isNormalVip}}{{if data.expiredVip && data.isActText}}{{else if data.expiredVip && !data.isActText}}{{else}}{{/if}}{{else if d
wordpress 插件新页面/迈步者seo
点击查看全文 阿里巴巴18周年年会已圆满落幕。十八岁,意味着成人,意味着更大的担当和责任。上次在这个帖子里:史上最盛大的黑科技年会前夕,阿里妹做了一个重大决定 阿里妹发了一个问题:“18岁的时候
高清美女写真生成新突破:用AI工具创造你的虚拟女友
在这个科技快速发展的时代,AI技术已经渗透到我们生活的方方面面,尤其是在艺术创作领域。你是否曾想象过,利用AI工具生成一张超逼真的美女写真,或许这位虚拟美女正是你欣赏艺术的化身?今天,我们将深入探索几款在美女写真生成领域备受瞩
神马搜索移动适配指南(神马搜索客户端)
1. 基本功能供站长提交pc->wap对应关系,神马搜索根据对应关系将收录的PC页替换为wap页2. 适用范围网站兼有PC版和Wap版3. 移动适配方式A. 自主适配B. 标注META声明C. 提交页面对应关系3.1 自主适配1)含义站长自己做好PC和wap网页的自适配
粤Z年检代办指引及要求
粤港车牌申请条件个人申请:1任期内担任县(市、区)级以上人大代表及政协委员2曾向内地善心捐款500万以上的海外华人华侨港澳台同胞注:个人车牌无法转让,企业车牌可以进行转让企业申请:1FV车牌(大陆→香港)一、在我省办理核准的国有企
轻极企业WordPress主题安装使用教程
轻极企业是一款非常强大的WordPress企业主题,这款主题采用扁平化设计、长页面视觉以及轻量化的jq动画脚本制作,灵活度非常高,如果你想要了解这款主题的功能,可以阅读这篇教程,帮助你了解更多。这款主题由5个分类目录列表模板,3个内页
华为荣耀9最新配置,科技与美学的巅峰融合
摘要:华为荣耀9配置全新升级,科技与美学的完美结合。这款手机拥有卓越的性能和出色的外观设计,为用户带来极致的使用体验。配置强大,运行流畅,同时注重细节和用户体验,展现了华为在科技领域的领先地位。华为荣耀9,一款值得期待的科技
网页复制粘贴助手,Chrome网页复制插件(谷歌浏览器复制插件)
Enable Copy是一款针对以Chrome为内核的浏览器的破解网站禁止复制插件,当用户安装好此插件,只需要点击浏览器右上角的Enable Copy 插件图案,即可复制那些网页不能复制的内容,对于从事编辑的人员非常有用,建议下载收藏。注意事项:1.Ena
用AI生成超逼真美女写真:探索最新AI绘画工具的使用技巧
Artbreeder:这是一款十分流行的AI生成作品平台。用户可以通过组合不同的图像生成新的艺术作品,尤其擅长生成独特的人物画像。Artbreeder的优点在于你可以通过简单的滑动条调整人物特征,如脸型、眼睛、头发等,产生意想不到的效果,但可能
贵州天眼旅游攻略_天眼必去旅游景点_天眼旅游攻略
贵州天眼旅游攻略_天眼必去旅游景点_平塘天眼旅游攻略 天眼简介: 天眼(500米口经球面射电望远镜FAST)位于贵州省黔南布依族苗族自治州平塘县克度镇大窝凼的喀斯特洼坑中,工程为国家重大科技基础设施,天眼工程由主动反射面系统、馈源支
相关文章
推荐文章
发表评论
0评