(本文基于清华大学刘嘉教授在「腾讯学堂同学汇——智启未来·AI合肥游学者之旅」的主题演讲内容整理)
作者 | 刘燕妮
自2022年11月30日ChatGPT问世以来,生成式人工智能如同晨星破晓,预示着一场引领新时代的技术变革。这场变革的热潮迅速席卷全球,各行各业的人们都感受到了它可能带来的颠覆性影响。在这个百年未有之大变局中,理解生成式人工智能的深层逻辑及其可能对人类社会和商业世界带来的范式变革,显得尤为重要。
01 AGI与AI:人类和类人猿的区别
腾讯CHO私董会,自21年首次举办活动以来,至今已组织了5期主题学习,共45家伙伴企业的CHO加入我们,他们来自不同的行业、处于不同发展阶段,这让我们每一次的碰撞与交流,都非常丰富而有趣。
当我们谈论人工智能时,你可能会想到过去十几年关于AI的各种成就:人脸识别、文字识别能力、大数据分析能力、甚至是战胜李世石的AlphaGo。然而,我们当下讨论的AGI与过去的AI有何不同呢?
我们可以用下图的四象限将人工智能做一个分类。四象限的一个维度代表环境(X轴),环境分为开放环境和封闭环境。封闭环境下,人工智能要处理的任务是确定的,而开放环境下,人工智能要处理的任务则是不确定的。另一个维度代表任务的性质(Y轴),任务分为静态和动态。静态任务类似于分析工作,确定而具体,例如人脸识别;而动态任务则随情况变化,如教学活动,老师需要根据同学的反应灵活调整讲课的内容和与同学的互动方式。
环境和任务两个维度可以将人工智能分成四个象限,其中人脸识别、文字识别等AI能力,属于第三象限(CV),AI需要在封闭环境下完成简单的静态任务,主要是识别与分类。2016年击败李世石的“围棋高手”AlphaGo属于第二象限(RL),AI要在下棋的封闭环境下处理动态任务,根据对手的着法,灵活应对。第四象限(Cybernetics)的典型代表则是波士顿动力的机器狗,它需要在开放的环境(房间/室外/平地/楼梯等)下执行静态任务(探索和反馈),这是一种简单的控制类反馈。
因此,我们可以说,如果将第二象限到第四象限的任务处理称为AI,将第一象限称为AGI,他们之间的差异就像类人猿和人类的差异一样巨大。
02 ChatGPT从何而来?
“语言是思想的载体”
如果我们希望人工智能像人类一样思考和运作,首要条件是使其具备人类的思维能力。那什么是思维呢?哲学家Holmes曾说过:“语言是灵魂的血液,思想在其中运行、从中生长”。思维的载体是语言,我们对这个世界的认识是通过语言的描述来实现的。语言包含了我们人类所有的思维、所有的逻辑、所有的理性,语言的边界即世界的边界,这一点对人脑或对机器都适用。
因此,AI具备语言能力是具备思维能力的重要路径。深度学习之父Geoffrey Everest Hinton有过一个浪漫的描述:“毛毛虫提取营养物质然后化茧为蝶,GPT-4已经提取了数十亿思维的金块,吸取了我们的营养,最终化茧为蝶。”
这也是为什么大模型通常被称为大语言模型LLM(Large Language Model)。
从人类的进化理解AGI三要素:大算力、大参数、大数据
回看人类从能人到智人的进化历程,如果把人类发明的工具作为人类智能的重要标志的话,从大约300万年前至10万年前左右,人类所发明工具的种类并没有明显的变化。这说明人类的智力在漫长的300万年间没有太大进化,这段时间在人类进化史中甚至被称为“历史垃圾时间”。
为什么会有这样的爆发和突破?一种比较合理的推理是,尽管在过去的300多万年的“垃圾时间”里,虽然人类的智力没有明显的突破,但是大脑的体积却在不断增长,人脑有了更多的神经元数量、更复杂的连接以及更先进的脑结构。 这是进化史上的一大奇迹,因为从进化的角度上看,没有其他任何一个器官能够在300万年这么短的时间里面,体积增加了接近3倍 。
当人类大脑有了更强的算力、能理解更多维的参数,解析更大量的数据后,智能发生了质的飞跃,促成了人类的第一次认知革命。
同样的道理也适用于人工神经网络。如果我们希望神经网络能具备像人一样的思维能力,也必须要其有更丰富、更深的网络连接。Hinton毕生的研究与追求,就是让人工神经网络变得更深,也就是我们常说的深度学习Deep Learning。他坚信:“人类大脑就是通过神经元连接来的。人工智能它没有理由不能实现,如果现在不能实现, 只是因为我们做的太浅、太小”。Hinton的学生、OpenAI的CTO Ilya Surskever也说过:“我有一个非常明确的信念:不要对深度学习抱有怀疑态度。如果想做人工智能,就要相信深度学习,深度学习就是人工神经网络的根本,无需质疑。”
正是在这样的信念的引导下,2020年中,拥有大算力、大参数和大数据特点的GPT-3问世了,就像人类大脑积蓄了几百万年后的爆发一样,新一代人工智能达到了“暴力美学的巅峰”。
从GPT-3到ChatGPT:基因完美的“婴儿”也需要训练
但两年半后OpenAI发布的ChatGPT,震惊了世界。它不再是一只鹦鹉,而是更像一个人了。这两年到底发生了什么?为什么GPT-3不行,而ChatGPT以及后来的GPT-4又行了呢?
我们用一个简单的假设来说明:假如我们把一个现代的婴儿送回到3000年前,是否比原始社会的婴儿更厉害?答案当然是“否”,因为原始人和现代人类的大脑没有差异。但是,如果把一个经受过现代教育的成人送回到原始社会,他是否会比原始社会的人更厉害?当然可以。为什么?因为在同样基因的大脑条件下,现代人接受了更先进的教育。
把这个假设放到GPT上,就很容易理解这背后的原因。我们可以认为GPT-3是一个有完美基因、但尚未接受教育的“婴儿”,所以它的表现差强人意。OpenAI用两年半的时间对它进行教育,这个教育包括prompt工程(传道)、强化反馈(授业)、与人类世界观、人生观、价值观做对齐(解惑)。受过教育后,它开始展现出强大的能力,也就是我们后来看到的ChatGPT和后来GPT-4。
03 AGI带来的范式变革
范式变革,最早是1962年由美国著名科学哲学家、历史学家托马斯·库恩在《科学革命的结构》一书里提出的。他认为,科学的进步不是通过渐进的知识积累而实现的,而是通过一系列的革命来实现的,是一种主导的范式被另外一种范式所替换。什么叫做革命?革命是我们对周围世界的观念和认知发生根本性的变化,是支配性的思维方式、基本的假设和实践产生天翻地覆的变化,才能称为范式变革。今天AGI对人类社会带来的影响,就是范式的变革。
商业的范式变革:摩尔定律也适用于服务
AGC对商业会带来什么影响?我们先来看一个故事。英国著名推理小说家阿加莎在她的自传提到,1919年作为中产阶级的她年收入是700英镑/年,她可以在伦敦市中央拥有一栋小洋楼,雇佣了一位女佣(30英镑/年)负责生活起居,以及雇佣一位专业护士(40英镑/年)照顾孩子。但她认为自己永远不可能买得起一辆汽车,当时最便宜的福特汽车是170英镑。但到现在来看,我们大部分家庭能够买的起汽车,但没有能力同时雇佣女佣和专业的护士。
这就是前三次工业革命的成果,商品价格不断降低,但服务价格越来越贵。这就是英特尔联合创始人戈登·摩尔提出的“摩尔定律”,随着生产效率的持续提升,商品的价格变得越来越低。(摩尔定律:集成电路中,晶体管数量将会随着时间的推移而指数级增长,而成本会相应地下降。虽然摩尔定律最早应用于工业领域,但后来也被引用于描述一些商业社会的现象。)
OpenAI创始人Sam Altman认为,摩尔定律也适用于服务行业。2019年,他曾在公司微博上低调地发表了一篇文章:《万物摩尔定律》。文章提到:摩尔定律不仅适用于商品,也适用于服务。通用人工智能将带来第四次工业革命,其可以让服务的价格不断降低,比如律师、会计、教师等等。
人类社会的范式变革:新平等、新财富
AGI的来临,对商业会带来翻天覆地的变化,对人类社会又会有什么深刻的影响呢?前三次工业革命带来了生产方式的根本性变化,机器的使用和工厂系统的建立实现了生产过程的机械化和大规模集中。人们意识到将生产过程分解为多个任务,并由专业的工人完成各项任务,能够进一步提高生产效率,这就逐步形成了现代分工体系。
但AGI的出现对分工体系产生了革命性的影响。以Sora出现为例,过往制作一个视频需要编剧、摄影师、动画师、后期编辑、演员等多个岗位协同合作。然而,在Sora的帮助下,任何人都可以通过输入一段文字描述生成任何想要的精彩视频。类似这样的现场还会层出不穷,这将会使现代社会产生两个本质的变化:
新平等:脑力成为更加核心的竞争力。远古时代,人的平等建立在“体能”上,谁的拳头硬谁就有话语权。现代社会,人的平等建立在“技巧”上,谁有专业技能、谁更精进,谁就更有竞争力;但AGI时代,“脑力”的PK逐步会成为竞争力的核心。一个人可以身体残疾、也可以没有摄影或画画的专项技巧,但是其脑袋里面的各种奇思妙想和思考洞察力,将成为竞争的核心。
新财富:时间成为财富的重要组成部分。前文我们提到,在人类进化史上有一段漫长的“垃圾时间”,人类智力水平没有显著提升,科技鲜有突破,因此时间这个维度并不十分重要。但是,在AGI时代,科技的发展日新月异,人工智能的技术以72小时为单位在更迭,时间成为了至关重要的因素。谁能更好地利用时间,谁在单位时间内创造更大的价值,将成为衡量财富的重要标志。
人的应对:通识教育、创新力与野心
围绕新平等和新财富的变化,我们个体也必然要做出相应的转变,这其中特别深刻的、我们想要重点讨论的,是三点,AGI时代下通识教育的重视、创新力的保持和野心的激发。
通识教育:人类更重要的能力回归通识能力。前三次工业革命催生了专业的分工,进而形成了现代教育体系,教育按照专业/学科划分培养专业人才。但随着AGI的出现,很多技巧性的、专业化的工作,可以交给人工智能完成。而人类更重要的能力,反而回归到通识能力,包括:逻辑思考力(从已知事实得出正确的结论)、数理洞察力(看懂数据的含义,得出自己的分析)、研究能力(发现问题、研究问题、解决问题)、社交能力(理解他人、理解自己)和说服他人的能力等等。
野心:百年未遇之大变革的时刻,野心赋予人类勇气与信念。2016年OpenAI成立的时候,还是一个不起眼的公司,英伟达黄仁勋当时就将公司刚研制的首台超算DGX-1捐赠给了这家成立不足一年的新公司。机器上有一行字,表达了对OpenAI团队的祝福:“为了计算和人类的未来,我捐出世界上第一台DGX-1。” AGI时代犹如破晓的晨曦,蕴藏着史无前例的机遇和可能性。在这个特殊而重要的历史时刻,人类需要更多的野心、更多的信念和坚定,去参与、去创造、去成就人类美好的未来。
04 人机共处:美美与共,天下大同
谷歌未来科学家库兹韦尔曾预测,2029年真正意义的人工智能就会出现。随着AGI的不断发展,关于人类与AI的关系、两者应该如何共存也越来越多的被讨论,不论是谷歌联合创始人Larry Page物种主义和Elon Musk人类优先主义的争论,还是对于AGI的研发应该是有效加速还是超级对齐的讨论,都不可否认地表明我们正在迈向一个人类与AI共生的新时代。
或许人工智很快在逻辑、数理、识别等领域超越人类,但我们坚信,在情感认知、创新能力和道德判断方面,人类的独特优势无可替代。Sam Altman曾说过:“世界将发生翻天覆地的变化。我们正处于巨变的开端,人类有一个难能可贵的机会去打造未来。”相信人类独有的价值将在我们与AI共生的未来中发挥至关重要的作用,引领我们继续深入理解并塑造一个和AI和谐共存的明天,让人类璀璨文明渊远留长。
智启未来·合肥AI创新之旅
本次「智启未来·合肥AI创新之旅」游学面向腾讯CHO私董会和腾讯学堂同学汇同时开放,腾讯学堂同学汇通过主题游学、直播大课等形式,面向腾讯学堂对外所有高管项目学员开展紧跟行业热点、关注产业前沿、形式丰富多样的学习交流活动,为新老同学们创造跨界学习、拓展圈层、拉通合作的机会。本次游学共计有70名来自腾讯CHO私董会、远航计划、企航计划、腾飞计划、腾讯Wecity加速器、智慧金融学堂和远洋计划的高管同学参与。