分享好友 最新动态首页 最新动态分类 切换频道
AIGC周报 | 腾讯大模型上线文生视频,并宣布开源;“AI教母”李飞飞空间智能首个模型诞生!一张图可生成交互式3D场景
2024-12-27 05:28

  近年来,随着大数据、云计算、深度学习等技术的飞速发展,AIGC作为人工智能领域的重要分支,正深刻改变着内容创作、信息检索、人机交互等多个领域。接下来让我们一起来看看过去的一周AIGC领域发生的新鲜事!

  腾讯大模型上线文生视频,并宣布开源

  12月3日,腾讯宣布,混元大模型上线并开源文生视频能力,参数量达130亿,支持中英文双语输入。“用户只需要输入一段描述,即可生成视频。”腾讯混元相关负责人透露,目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。目前该模型已上线腾讯元宝App,用户可在AI应用中的“AI视频”板块申请试用。企业客户通过腾讯云提供服务接入,目前API同步开放内测申请。

图片来源:腾讯混元微博截图

  可灵AI导演共创计划9部AIGC电影短片正式上线

  12月6日,由快手可灵AI联合李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等9位导演打造的9部AIGC电影短片正式亮相,涵盖奇幻、志怪、亲情、动画等多元类型。首映礼现场,快手将可灵AI导演共创计划的9部AIGC电影短片捐赠给中国电影博物馆。作为中国首个AIGC导演共创计划的成果,9部AIGC电影短片被中国电影博物馆永久收藏、放映展示。

图片来源:可灵AI微博截图

  艾媒分析师点评:AI生成视频技术的迅猛发展正引领着影视创作与传播的深刻变革。2024年年初OpenAI发布的sora让世界看到了AI生成视频令人惊叹的质量,而时至今日仍未对外开放的sora似乎正在被一大批中国的视频生成模型迎头赶上。腾讯混元大模型的文生视频能力上线并开源,标志着国内在视频大模型领域的又一重要突破,其130亿参数量与双语支持展现国产视频生成模型技术的强大实力。与此同时,快手可灵AI通过导演共创计划,将AIGC电影短片推向实际应用,不仅拓宽了艺术创作的边界,也为中国电影博物馆增添了未来艺术的瑰宝。

  除了电影短片,2024年9月,《聊斋志异》系列AI短剧上线各大平台,从短剧到电影短片,是AI生成视频在质感、逻辑、连贯性上的全面提升。目前,AI生成视频正逐步渗透影视、广告、游戏等行业,这一趋势不仅重塑了内容生产的模式,也为文化产业注入了前所未有的活力与创造力,未来,AI生成视频技术将持续拓展应用场景,推动影视行业的全面革新与发展。

  阿里云通义团队发布全新AI推理模型QwQ-32B-Preview,并同步开源

  11月28日,阿里云通义团队发布全新AI推理模型QwQ-32B-Preview,并同步开源。QwQ(Qwen with Questions)是通义千问Qwen大模型最新推出的实验性研究模型,也是阿里云首个开源的AI推理模型。阿里云通义千问团队研究发现,当模型有足够的时间思考、质疑和反思时,其对数学和编程的理解就会深化。

  OpenAI推出“满血版”推理模型o1和ChatGPT Pro

  12月6日,OpenAI为期12天的活动开幕。在第一天的活动上,OpenAI创始人Sam Altman表示,今天发布的是“满血版”推理模型o1和ChatGPT Pro(每月订阅费200美元)。据介绍,o1是世界上最智能的模型。比o1-preview更智能、更快速、功能更多(例如多模态)。现已在ChatGPT中上线,即将在API中推出。新推出的ChatGPT Pro将能够充分利用模型和工具,包括无限接入OpenAI o1和一个仅仅有Pro版本的o1。

  艾媒分析师点评:当前,推理AI正在蓬勃兴起。从国外OpenAI的o1到国内通义千问的QwQ、月之暗面的k0 math和Deepseek的DeepSeek-R1-Lite,一个个具有推理能力的AI大模型昭示着人工智能正一步步学会像人类一样深度思考与推理,而非像传统的大语言模型那样只能理解字面意思、搜索并整理海量信息却较难进行自我判断与纠正。国产推理大模型表现出色,在一些数学能力评测中,得分甚至不输于o1,在全面考察数学解题能力的MATH-500评测中,QwQ斩获90.6%的高分,一举超越了o1-preview和o1-mini。采用强化学习和思维链推理技术的大模型能够试图模拟人类的思考和反思过程,从而增强AI的数学推理能力。推理AI的发展与完善将帮助人类解决复杂困难的数学问题,促进知识的发展,进一步推动国际事务和科学技术等领域难题取得突破性进展。

  “AI教母”李飞飞空间智能首个模型诞生!一张图可生成交互式3D场景

  当地时间12月2日,AI学者、斯坦福大学教授李飞飞公布了她第一个创业项目World Labs的成果——能用单张静态图片生成3D世界的AI产品。虽然已有众多AI工具可以将照片转换为3D模型和场景,而World Labs称,他们所生成场景的独特之处在于它们具有交互性,而且是可修改的。“(我们的技术)能让你走进任何一张图像,并以3D的形式对其进行探索。”World Labs在一篇博客文章中写道。在World Labs网站的演示里,这些由AI生成的场景均通过浏览器实时渲染而成,用户可以使用箭头键或键盘(WASD)键移动,然后单击并拖动鼠标实现交互,从而自由探索场景。

  DeepMind发布新基础世界模型Genie 2,解锁游戏制作新纪元

  仅在李飞飞的团队发布新模型的两天后,当地时间12月4日,谷歌DeepMind官宣了其最新一代大规模基础世界模型Genie 2,可通过单张图片和文字描述生成种类多样的可玩3D世界。Genie 2与World Labs有诸多相同之处,如单图生成可交互3D场景、空间记忆能力和扩图能力,但在底层技术逻辑上,二者仍有本质区别。普林斯顿AI创新中心创始人、主任,终身教授王梦迪表示Genie2使用的是video diffusion(视频扩散)技术,每一帧画面的生成都基于pixel prediction(像素预测),并通过额外的用户输入的引导来影响下一帧的概率分布;而World Labs则做到了挖掘世界的物理本质,从图片出发,估计图片中不同景物的深度和相对关系,从而生成了更加物理世界的3D环境建模。

  艾媒分析师点评:“世界模型”是近年来兴起的人工智能新领域,该类模型旨在创建对世界运作方式的内部表征,并具备推理行动后果的能力,可用于预测未来环境状态,帮助AI做出更明智的决策。World Labs和DeepMind发布的世界模型标志着AI技术在模拟和交互虚拟环境方面的巨大进步。这些模型不仅能够从单张图片生成可交互的3D场景,还提升了控制力和一致性。World Labs的系统通过估算3D几何形状和填补场景中未见部分,生成新内容,使用户能够以游戏般的方式自由探索3D场景。而DeepMind的Genie 2则能够生成可交互的3D游戏,并且保持虚拟世界的一致性,即使在视野之外也能准确再现场景。这些技术的应用将改变电影、游戏、模拟器等数字内容的制作方式,为创作者提供更快速的构思和开发流程。同时,作为世界模型,它们在机器人技术、游戏开发和气候建模等领域的潜在影响也不容忽视,为AI的未来发展开辟了新的可能性。

  广电总局再发管理提示,规范AI“魔改”短视频

  12月7日,广电总局网络视听司发布《管理提示(AI魔改)》指出,近期,AI“魔改”视频以假乱真、“魔改”经典现象频发。如《甄嬛传》变身“枪战片”、《红楼梦》改成“武打戏”、孙悟空骑着摩托车扬长而去等。《管理提示》认为,这些视频为博流量,毫无边界亵渎经典IP,冲击传统文化认知,与原著精神内核相悖,且涉嫌构成侵权行为。《管理提示》提出具体管理要求。首先,各相关省局督促辖区内短视频平台排查清理AI“魔改”影视剧的短视频,并于12月10日反馈工作情况;第二,严格落实生成式人工智能内容审核要求,举一反三,对各自平台开发的大模型或AI特效功能等进行自查,对在平台上使用、传播的各类相关技术产品进行严格准入和监管,对AI生成内容做出显著提示。

  加拿大多家媒体起诉OpenAI侵犯版权

  艾媒网(iimedia.cn)获悉,加拿大多家主流媒体11月29日入禀法院,以侵犯版权为由,对开发人工智能应用ChatGPT的美国科技公司OpenAI联合提起诉讼。兴讼媒体指称,OpenAI“经常违反”版权和在线使用条款,从加拿大媒体上抓取大量内容,以帮助开发ChatGPT等产品。OpenAI在未获内容所有者许可或对此作出补偿的情况下,利用这些内容并从中获利。

最新文章
新奥长期免费资料大全|经典解释落实
  在当代社会,获取知识变得越来越便捷,新奥长期免费资料大全就是这样一个平台,它致力于向公众提供丰富的学习资源,包括但不限于经典文献、研究报告、学术论文等,覆盖各个学科领域。本文将以“新奥长期免费资料大全 | 经典解释落实”
论文ai写作网站有哪些 论文ai写作网站一览
论文ai写作网站有哪些,AI写作网站是一个能够帮助用户更高效地进行创作和写作的工具。用户只需提供一些关键信息,AI就可以自动生成文章的内容,从而大大提升了创作的效率。这对于有时间压力或者灵感不足的用户来说,是一个非常有用的辅助工
梦幻西游最强的宝宝没有之一,神马浮云在它面前都是垃圾
梦幻西游中召唤兽跟随号主南征北战,为自己的武神之战付出汗马功劳,也获得了丰功伟绩;今天咱们就说一说梦幻西游中最强悍而且已经是绝版的召唤兽,绝对是站在武神坛顶端的宝宝了,价值肯定超过最少两百万,神马浮云在它面前就是垃圾,咱们
谷歌adsense广告怎么赚钱?英文网站通过google广告盈利赚美金
想赚美金,又不想太累?那就来做英文内容网站去挂谷歌ADSENSE广告来赚钱吧。如何去做一个高级的英文内容网站,并把它当做一个资产去沉淀和积累,获取大流量后稳稳收益?依内容营销为指导,把网站上每一项内容都做成可以长期沉淀的资产,帮
蚂蚁庄园答案合集(蚂蚁庄园答案大全集结,轻松解锁庄园秘籍)
随着移动互联网的普及,各类手机应用层出不穷。其中,蚂蚁庄园作为一款集娱乐、知识于一体的游戏应用,深受广大用户的喜爱。蚂蚁庄园答案合集(《蚂蚁庄园答案大全集结,轻松解锁庄园秘籍》)正是为了满足用户在庄园游戏中遇到的各种问题而
骛与鹜的区别
描写黄山天都峰的诗句:1、孤峰突兀现青虚,喜若羁人望故都。神马已驰身尚远,却疑真有二文殊。——李弥逊《次韵公显宫教实见天都峰》2、奇险天都著,遥观亦有缘。大雄无与并,苍浑莫之先。倏忽阴晴异,逡巡起伏迁。云腾致雨气,水泻在山泉
最新款手机排行榜前十名(2023年畅销机型排名)
2023年最新款手机排行榜前十名在2023年的手机市场中,各种品牌的新机型层出不穷,竞争激烈,以下是基于销售数据和用户评价,我们列出的2023年最新款手机排行榜前十名:1. iPhone 14 Pro处理器:A16芯片屏幕:6.1英寸 Super Retina XDR 显示
首个机器人与AI共建平台落地亦庄,引爆智能制造新机遇
在科技界,机器人和人工智能的结合被视为未来工业的曙光,而现在,这一曙光似乎正照耀着北京亦庄。12月9日,北京京东数智工业科技有限公司(简称“京东工业”)与科大讯飞股份有限公司(简称“科大讯飞”)在亦庄签署了一项颇具里程碑意义
最官方的淘宝标题优化技巧,关键词拆分与重组
  前面小编给大家分享了一个官方标题优化的方法,今天给大家说说大家一直关心的分词、可拆分词和不可拆分词、标题空格等问题对于标题搜索有什么影响,这里开淘小编特意把最官方的信息收集过来给大家,希望能帮助到你们!  一、分词问题
远程查看对象微信聊天记录软件(如何偷偷监控老婆手机)
远程查看对象微信聊天记录软件(如何偷偷监控老婆手机)   打开微信,点击顶部的搜索框,输入关键词(如联系人名、内容等),直接查找相关聊天记录。翻阅历史聊天记录进入与某人的聊天页面,向上滑动查看历史记录,直到找到需要的信息。聊
相关文章
推荐文章
发表评论
0评