分享好友 最新动态首页 最新动态分类 切换频道
阿里吴泳铭:生成式AI的最大想象力,不是做超级应用,而是改变物理世界 | 最前线
2024-12-25 17:24

文 | 邓咏仪

阿里吴泳铭:生成式AI的最大想象力,不是做超级应用,而是改变物理世界 | 最前线

编辑 | 苏建勋

又一年过去了,AGI进度如何了?

自OpenAI的ChatGPT震撼全球,全球AI界的终极目标——AGI(通用人工智能)暂未实现。但全球AI界的风向标,已经从谈GPT-4为主的通用、底层大模型(Foudation Model),快进到2024年的多模态。

一切都围绕着AI应用展开了。从年初的Sora、Suno,到近期的o1(OpenAI的多模态新模型)、Cursor(AI编程应用)和火得不可开交的机器人(新时代的时髦称呼:具身智能),毫无疑问,AI正在加速落地,并且走入物理世界中。

在国内,阿里可谓是对这波生成式AI浪潮投入力度最大,节奏最为激进的巨头。阿里自己的通用大模型家族”通义“,从底层的通用大模型,到图像、视频、代码等领域的应用,均有覆盖。

在外部,阿里甚至还投资了国内大模型六小虎中的五家,出手果决——现任阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭则是这场AI浪潮中,主导阿里动向的主舵手。2023年,吴泳铭在接任阿里云后,就马上提出了”AI驱动、公共云优先“的战略。阿里云整体开始了一场降本增效,剑指AI的大变革,目标更加集中。

在9月19日演讲的演讲中,吴泳铭表示,过去22个月,AI发展的速度超过任何历史时期,但我们依然还处于AGI变革的早期。”生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的Super App,而是接管数字世界,改变物理世界。“他说。

核心观点:

  • AI发展速度已经超过任何历史时期,但依然处于AGI变革的早期。
  • 下一阶段先进模型的投入门槛是几十亿、几百亿美金级别。
  • 生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。
  • 机器人将是下一个迎来巨变的行业。未来所有能移动的物体都会变成智能机器人。
  • 未来几乎所有的软硬件都会具备推理能力,它们的计算内核将变成GPU AI算力为主、CPU传统计算为辅的计算模式。
  • 过去一年,阿里云投资新建了大量的AI算力,但还是远远不能满足客户的旺盛需求。
  • 人们对新技术革命,往往对短期高估,又对长期低估,但它会在你的怀疑中成长,在你在迟疑中错过大趋势。

欢迎来到2024云栖大会。在刚刚过去的夏天,阿里云全面支撑巴黎奥运会实现了历史性突破,云计算首次超越卫星,成为奥运主要转播方式。AI也首次广泛应用于奥运会。今天,云栖大会的焦点也是AI。我主要分享三点内容:

第一,过去22个月,AI发展的速度超过任何历史时期,但我们现在依然还处于AGI变革的早期阶段。

大模型技术快速迭代,技术可用性大幅提升。大模型已经具备了文本、语音、视觉的多模态能力,能够开始完成复杂指令。去年,大模型还只能帮助程序员写简单的代码,今天已经能直接理解需求,完成复杂的编程任务。去年,大模型的数学能力还只有中学生水平,今天已达到国际奥赛金牌水平,并在物理、化学、生物等多方面学科接近博士水平。

同时,模型推理成本指数级下降,已经远远超过摩尔定律。一年来,通义千问API在阿里云百炼上的调用价格下降了97%,百万Tokens调用花费最低已经降到了5毛钱。推理成本是应用爆发的关键问题,阿里云会努力把成本继续降下去。

开源生态蓬勃发展。今年6月,通义千问开源Qwen2,迅速登顶Huggingface的全球开源模型排行榜。在Huggingface上,Qwen的原生和衍生模型接近5万个,排名全球第二。阿里云魔搭社区上有超过1万个模型、服务了超过690万开发者。

这一切才刚刚开始,要实现真正的AGI,下一代模型需要具备更大规模、更通用、更泛化的知识体系,同时也将具备更复杂更多层次的逻辑推理能力。全世界先进模型竞争的投入门槛,将达到数十亿、数百亿美金的级别。AI具备创造能力、帮助人类解决复杂问题的路径清晰可见,也打开了AI在各行业场景中广泛应用的可能性。

第二,AI最大的想象力不在手机屏幕,而是接管数字世界,改变物理世界。

今天很多行业内人士一直在想AI最大的应用是什么,可能一直在想手机上有什么AI时代创新的超级APP。但我们认为AI最大的想象力绝对不是在手机屏幕上,AI最大的想象力是在通过渗透数字世界、接管数字世界,并改变物理世界,这才是AI最大的想象力。

我们不能只停在移动互联网的视角看未来。生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。

过去三十年,互联网浪潮的本质是连接,互联网连接了人、信息、商业和工厂,通过连接提高了世界的协作效率,创造了巨大的价值,改变了人们的生活方式。但生成式AI是通过生产力的供给创造了新的价值,从而为世界创造了更大的内在价值,也就是总体提高了整个世界的生产力水平。这种价值创造,可能是移动互联网连接价值的十倍、几十倍。

我们认为生成式AI将逐渐渗透数字世界,并接管数字世界,物理世界的大部分事物都会具备AI能力,形成下一代的具备AI能力的全新产品,并与云端AI驱动的数字世界连接产生协同效应。

很长一段时间,AI的焦点主要集中在模拟人类的感知能力,比如自然语言理解、语音识别、视觉识别。但是生成式AI的崛起,带来了质的飞跃,AI不再仅仅局限于感知,而是首次展现了思考推理和创造的力量。

生成式AI让世界有了一个统一的语言——Token。它可以是任何文字、代码、图像、视频、声音,或者是人类千百年来的思考。AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面,比如人类行走、奔跑、驾驶车辆、使用工具,绘画、作曲、写作、表达、教学、编程的技巧,甚至是开公司创业。理解之后,AI就可以模仿人类去执行物理世界的任务。这将带来新的产业革命。

我们看到,汽车行业正在发生这样的变革。之前的自动驾驶技术,是靠人来写算法规则,几十万行代码,仍然无法穷尽所有的驾驶场景。采用“端到端”的大模型技术训练后,AI模型直接学习海量人类驾驶视觉数据,让汽车具备了超越大部分司机的驾驶能力。

机器人将是下一个迎来巨变的行业。未来,所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员、包括家庭里的宠物狗、保姆、助理。

未来,工厂里会有很多机器人,在AI大模型的指挥下,生产机器人。现在每个城市家庭里有一辆或者两辆车,未来每个家庭可能会有两三个机器人,帮助人们提升生活当中的效率。

可以想见,AI驱动的数字世界连接着具备AI能力的物理世界,将会大幅提升整个世界的生产力,对物理世界的运行效率产生革命性的影响。

第三,AI计算正在加速演进,成为计算体系的主导。

无论是我们看到端侧的计算,还是云端的世界,这都是一个非常明显的趋势。生成式AI对数字世界和物理世界的重构,将带来计算架构的根本性变化。过去几十年,CPU主导的计算体系,正在加速向GPU主导的AI计算体系转移。未来几乎所有的软硬件都会具备推理能力,它们的计算内核将变成GPU AI算力为主、CPU传统计算为辅的计算模式。

我们看到,在新增算力市场上,超过50%的新需求由AI驱动产生,AI算力需求已经占据主流地位。这一趋势还会持续扩大。过去一年,阿里云投资新建了大量的AI算力,但还是远远不能满足客户的旺盛需求。

今天我们接触到的所有客户、所有开发者、所有CTO,几乎都在用AI重构自己的产品。大量新增需求正在由GPU算力驱动,大量存量应用也在用GPU重新改写。在汽车、生物医药、工业仿真、气象预测、教育、企业软件、移动APP、游戏等行业,AI计算正在加速渗透。在各行各业,看不见的新产业革命正在悄然演进。

所有行业,都需要性能更强、规模更大、更适应AI需求的基础设施。

阿里云正在以前所未有的强度投入AI技术研发和基础设施建设。我们的单网络集群已拓展至十万卡级别,正在从芯片、服务器、网络、存储到散热、供电、数据中心等方方面面,重新打造面向未来的AI先进基础设施。

从历史经验来看,人们对新技术革命,往往对短期高估,又对长期低估。因为在新技术应用早期,渗透率还比较低,人们经验没有发生过此类事件,大部分人的本能会产生怀疑,这很正常。但新技术革命会在人们的怀疑中成长,让很多人在迟疑中错过。

站在AI时代浪潮的开端,我感到无比兴奋。今天,我们请到大模型、自动驾驶和机器人三个领域的企业家和科学家。他们正在飞奔着用AI重构我们的世界,期待他们的精彩分享。

最新文章
[源码解析] PyTorch分布式优化器(3)---- 模型并行
本系列介绍分布式优化器,分为三篇文章,分别是基石篇,DP/DDP/Horovod 之中数据并行的优化器,PyTorch 分布式优化器,按照深度递进。本文介绍PyTorch 分布式优化器和PipeDream之中的优化器,主要涉及模型并行(流水线并行)。PyTorch分布
简单一百网课app
简单一百网课app,一般又称简单一百。
热门中高端手机大排行 京东焕新季补贴10%起
如今,对于手机品牌而言,要想掌控市场话题权,必须要在中高端市场站稳脚跟。2022年已经过去四分之一,手机市场新机不断。眼下正是京东手机焕新季,用户换机需求也日渐高涨。面对琳琅满目的机型,用户多少会不知道如何下手,京东各类手机热卖榜单
网站关键词优化步骤,让网站在搜索引擎中脱颖而出
随着互联网的快速发展,数量呈爆炸式增长,如何在众多网站中脱颖而出,吸引目标用户,成为企业关注的焦点。而网站优化是提升网站搜索引擎排名、吸引潜在客户的重要手段。本文将从关键词选择、布局、优化策略等方面,详细介绍网站关键词优化
PingPong深耕跨境支付场景创新,为企业出海提供本地化生态服务网络
  伴随西方传统节日临近,海外消费需求持续升温。从近日落幕的全球黑色星期五和网购星期一(下称黑五网一)购物季看,各大跨境电商平台战绩不俗,中国商家更是作出贡献的中坚力量。  11月份,制造业采购经理指数(PMI)新出口订单恢复至48.1%,
让你快速精通SEO优化
高转化页面的打造!这里210.30.208.205提醒大家,做SEO无论你技术怎么样,都要做好高转化页面的打造,否则你的SEO最终都会功 亏一篑,无论排名如何,高转化页面的方式很多,销售信的引导,免费的引导,低价的引导,绝对化优势的引导,做好
高清美女写真生成大揭秘:用AI技术打造你的虚拟女友
在当今这个科技飞速发展的时代,AI技术不仅改变了我们的工作生活方式,也彻底颠覆了我们的艺术审美。想象一下,你在朋友圈中悄悄发布了一张梦幻般的美女写真,朋友们纷纷点赞,而这张照片的创作过程仅需几分钟。这并不是未来科幻片中的情节
花30万读个港硕,我后悔了
“最新消息,今年可能不考虑港硕了。”看到秋招群里的对话,七月心底五味杂陈,本科毕业时,她陪同学去比亚迪面试,在现场亲眼见证了比亚迪对海归派的求贤若渴、来者不拒。如今,她读了个港硕、捧着QS名校研究生毕业证回来,面对的却是通道
楼上半夜又唱又跳,楼下房客睡不着写投诉信!长沙一直播公司:会装隔音棉
楼上半夜直播楼下住户睡不着网友入住酒店发现楼板嗡嗡作响,直播公司承诺会装隔音棉潇湘晨报记者 於广强 长沙报道近日,有网友反映,在长沙县一家电竞酒店入住,楼上一家直播公司半夜直播声音很大,影响休息,希望改进。记者现场探访发现,
鸿蒙系统用什么开发的
鸿蒙系统是由华为自主研发的分布式操作系统,主要采用微内核设计,使用了C/C++和Java作为主要开发语言。 鸿蒙系统的开发主要包括五个方面:微内核、分布式架构、ARK编译器、开发环境和应用生态。其中,微内核是鸿蒙系统的核心,而分布式架
相关文章
推荐文章
发表评论
0评