人工智能科普—初探生成式人工智能
生成式AI简介生成式AI的发展历程生成式AI的工作原理生成式AI的未来展望目录conten生成式AI简介PART01
生成式AI崛起:ChatGPT、文心一言等引领,开启内容创造新纪元。如果将人工智能按照用途进行简单分类的话,AI其实要被划分为两类:决策式AI和生成式AI。
决策式AI专注于分析情况并做出决策。它通过评估多种选项和可能的结果,帮助用户或系统选择最佳的行动方案。例如,在自动驾驶车辆中,就是通过决策式AI系统决定何时加速、减速或变换车道。视频:无人驾驶巴士
生成式AI专注于创造全新内容。它可以根据学习到的数据自动生成文本、图像、音乐、视频等内容。例如:你可以将几篇论文发给生成式AI,他可以生成一篇文献综述,囊括了这几篇论文的关键思想、重要结论。
生成式AI的发展历程PART02
第一阶段1、1950年的时候,AlanTuring(阿兰图灵)提出了著名的“图灵测试”,这是生成式AI领域的一个里程碑,预示了AI内容生成的可能性。2、1957年,LejarenHiller(列哈伦-希勒)和LeonardIsaacson(莱昂纳德·艾萨克森)完成了历史上第一首完全由计算机“作曲”的弦乐四重奏音乐作品《依利亚克组曲》《IlliacSuite》。列哈伦·希勒是音乐史上最早试验用电子计算机作曲的人之一。3、1964年至1966年间,JosephWeizenbaum(约瑟夫·维森鲍姆)开发了世界上第一款可人机对话的机器人(伊莉莎)“Eliza”,也是世界上第一个真正意义上的聊天机器人,它通过关键字扫描和重组完成交互任务。4、1980年代,IBM公司基于隐形马尔科夫链模型,创造了语音控制打字机(坦戈拉)“Tangora”。能够处理约两万(20000)个单词。1950195719641980S图灵测试计算机生成音乐对话机器人语音打字机
第二阶段随着互联网的发展,数据规模快速膨胀,为人工智能算法提供了海量训练数据。但是由于硬件基础有限,此时的发展并不迅猛。1、2007年,纽约大学人工智能研究员RossGoodwin(罗斯·古德温)的人工智能系统撰写了小说《1TheRoad》,这是世界第一部完全由人工智能创作的小说。2、2012年,微软公司公开展示了一个全自动同声传译系统,可以自动将英文演讲者的内容通过语音识别、语言翻译、语音合成等技术生成中文语音I小说同声传译
第三阶段2014年起,大量深度学习方法的提出和迭代更新,标志着生成式AI的新时代。1、2017年,微软人工智能少女“小冰”推出了世界首部100%由人工智能创作的诗集《阳光失了玻璃窗》。2、2019年,谷歌DeepMind团队发布了DVD-GAN架构用以生成连续视频。3、2020年,OpenAI发布ChatGPT3,标志着自然语言处理(NLP)和AIGC领域的一个重要里程碑。4、2021年,OpenAI推出了DALL-E,主要应用于文本与图像的交互生成内容。5、自2022年开始到现在,OpenAI多次发布ChatGPT新型号,掀起了AIGC又一轮的高潮,它能够理解和生成自然语言,与人类进行复杂的对话。2017201920202021AI诗集AI视频ChatGPT-3Dall-E2022至今ChatGPT更新
生成式AI的工作原理PART03
定义以ChatGPT为代表的生成式AI,是对已有的数据和知识进行向量化的归纳,总结出数据的联合概率。从而在生成内容时,根据用户需求,结合关联字词的概率,生成新的内容。制作一个生成式AI,就像把一个稻草人变成天才,一共需要四步:做稻草人→装大脑→喂知识→有产出。做稻草人装大脑喂知识有产出
算力--稻草人的骨架生成式AI需要进行大量的计算,尤其是在处理如图像和视频时。大规模计算任务离不开下面这些关键硬件:(1)GPU(图形处理单元):提供强大的并行计算能力。通过成千上万个小处理单元并行工作,大幅提高了计算效率。(2)TPU(张量处理单元):专门为加速人工智能学习而设计的硬件,能够显著加快计算速度,进一步增强了骨架的强度。
存力—稻草人的血液生成式AI需要处理和存储大量的数据。以GPT-3为例,光是训练参数就达到了1750亿个,训练数据达到45TB,每天会产生45亿字内容。这些数据的存放离不开下面这些硬件设施:(1)大容量RAM:在训练生成式AI模型时,大量的中间计算结果和模型参数需要存储在内存中,大容量的RAM能够显著提高数据处理速度。(2)SSD(固态硬盘):大容量的SSD具有高速读取和写入能力,可以快速加载和保存数据,使稻草人能够高效地存储信息。