从ChatGPT到Sora,OpenAI在一年多时间里连续发布两个重磅产品,彻底拉开了AI时代的帷幕。
有专家称,AI的变革对人类社会而言,堪比“工业革命”。
国内在惊羡于OpenAI强大的同时,不由得回头来看:中国何时能出现自己的“OpenAI”?
时代浪潮之下,创投资金涌动。一家成立不足1年的AI创业公司——月之暗面,被巨额融资“推出了水面”。
就在近日,月之暗面完成新一轮超10亿美金(折合人民币70亿元左右)融资,投资方包括红杉中国、阿里、美团等。此次融资后,月之暗面估值达约25亿美金,成为国内大模型领域的头部企业之一。
1.成立不到1年,单笔融资70亿
在OpenAI引领的新风向里,一场AI浪潮已然席卷市场。在英伟达等公司在二级市场股价创新高的同时,一级市场里也迎来一场全新的造富运动,引得无数资本尽折腰。
一时间,国内AI创业公司群雄并起,融资不断:
- 去年10月,百川智能完成了3亿美元的A轮融资;
- 同月,智谱AI也宣布年内累计获得25亿人民币融资;
- 更早之前,MiniMax获得超2.5亿美元的融资。
2023年3月,月之暗面成立于北京,刚刚成立就展现出超强的融资能力。
2023年7月,成立不到3个月,月之暗面就完成了天使轮融资,金额约20亿元,资方包括红杉中国、真格基金、今日资本等。今年2月初,就有媒体报道,月之暗面正在进行2亿美元的融资,投前估值约15亿美元。2月19日,又有媒体报道:该公司完成了超10亿美元融资。两笔融资前后仅仅相距17天。
成立不到1年,月之暗面单笔融资已超越国内主流AI创业公司,创下行业新高。
本轮融资完成后,月之暗面的估值将达到25亿美元,约合人民币179.5亿元,超过百川智能最近一次融资后的估值78亿元和智谱AI的100亿元,也高于MiniMax和零一万物的估值,成为目前国内大模型领域估值最高的独角兽。
月之暗面背后的投资方囊括了多家主流互联网公司,除了红杉中国这个专注科技的明星私募基金,阿里、小红书、美团也在名单里。
成立不到1年,融资70亿,月之暗面凭什么?
2.月之暗面凭什么?
月之暗面这个名字,来源于摇滚乐队Pink Floyd的专辑《The Dark Side of the Moon》,创始人杨植麟钟爱摇滚,大学期间,他曾组建校园摇滚乐队,并担任乐队的鼓手。
“这个名字象征着神秘与未知,与公司在人工智能领域的探索精神相契合。”
出生于1993年的杨植麟是广东汕头人,本科毕业于清华大学计算机科学与技术系,博士就读于卡内基梅隆大学语言技术研究所(LTI),师从苹果AI研究负责人Ruslan Salakhutdinov和谷歌首席科学家William Cohen。
在读博期间,杨植麟用4年时间完成了一般人6年才能完成的博士课程,并连续作为第一作者发表了两项关键研究成果——Transformer-XL和XLNet。
拥有漂亮履历的杨植麟是毋庸置疑的超级学霸,他的学术论文在华人学者引用排名中位居前10,在40岁以下排名第一。
2022年,ChatGPT横空出世。作为人工智能实验室Open AI开发的聊天机器人模型,ChatGPT在科技领域掀起热潮。
“ChatGPT刚发的时候,我非常激动,我好奇这个世界到底能做什么样的AI,我能多大程度去复制、甚至做得比人脑更好。同时,我也陷入到非常沮丧的状态——我会开始想在这个浪潮里我还能贡献什么,又开始兴奋起来:现在是非常好的timing,不管发生什么,一定要做。”
ChatGPT的出现让杨植麟很兴奋,他觉得自己是时候做点什么了。之后,他与两位清华校友周昕宇、吴育昕共同创立了月之暗面。
2023年10月,月之暗面推出全球首款支持输入20万汉字的智能助手产品Kimi Chat,除了联网搜索、知识查询、文本生成、翻译、图片识别等基础功能,Kimi Chat进行文本搜索所得出的内容是深入研究、挖掘更全面的信息。
发布之初,Kimi Chat就打出了“长文本”、“自研闭源”、 “to C”等标签,而20万汉字,是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度。
据报道,大模型应用效果通常取决于两个核心指标,一是模型参数量,决定了大模型的“计算”能力;二是能够接收多少文本输入,即长文本技术,决定了大模型的“内存”能力。
目前,全球大多数大语言模型的输入长度都在2K以内。相比当前市面上追求“面面俱到”的大模型,Kimi Chat重点突破了长文本技术的挑战。
作一个对比,Anthropic的Claude支持最大长文本为100k,约8万字;OpenAI的GPT-4则是32k,约2.5万字;也就是说,Kimi Chat的20万字,是Claude的2.5倍和GPT-4的8倍。
杨植麟强调,Kimi Chat通过创新的网络结构和工程优化,在千亿参数下实现了无损的长程注意力机制,不依赖于滑动窗口、降采样、小模型等常见的对性能损害较大的“捷径”方案。
这些改进允许Kimi Chat在不牺牲理解能力和生成质量的前提下,处理长达20万汉字的输入。
“这在当前的AI模型中是非常罕见的。”
这样的优势让Kimi Chat在金融、法律、科研等需要快速分析和总结长篇文档的领域,潜力巨大。
“支持更长的上下文意味着大模型拥有更大的内存,使大模型的应用更加深入和广泛。比如通过多篇财报进行市场分析、处理超长的法务合同、快速梳理多篇文章或多个网页的关键信息、基于长篇小说设定进行角色扮演等。”
有用户在使用Kimi Chat之后表示,“Kimi Chat适用于阅读长文,能提供摘要和进行多轮问答。”
月之暗面将长文本技术称之为大模型“登月计划”的第一步。
11月,月之暗面又发布了Moonshot AI开放平台,开发者可以在平台上创建自己的API Key,将Kimi智能助手背后的同款moon shot模型能力接入到自己的产品或打造出全新产品。
如此硬核的月之暗面,必定不能缺少一个硬核的团队。
据月之暗面内部员工称,月之暗面团队成员人数在近200人,汇聚了来自CMU LTI、Google、Meta、Amazon等全球顶级机构人才,在大模型、视觉、强化学习等AI技术创新方面实力强劲,比如,团队成员发明了RoPE相对位置编码,它是MetaLLaMa和GooglePALM等大多数主流模型的重要组成部分。
在杨植麟自己看来,人才密度是月之暗面最主要的一个特色。
“我们希望通过这种很高的人才密度以及组织力量,能够打造一个很快迭代的组织机器,让人才能够快速基于我们现有和未来发展出的技术,开发出比较好的产品。”
一位行业内人士指出,市场上大模型相关的人才非常稀缺,“真正有相关经验、有计划、有认知、愿意创业且在合适年龄的人其实并没有那么多,在算法创新方面的人才稀缺程度则比之更甚。”
这或许就是月之暗面被资本热捧的重要原因之一。
3.与OpenAI的距离
新年伊始,OpenAI再出王炸,Sora的爆火,不仅引发了人工智能大模型领域的投资热潮,还一举将生成式AI的关注点从文生文、文生图拉高至文生视频。
一位行业人士表示,“如果说AIGC(生成式人工智能)是AI领域皇冠,那么文生视频就是皇冠上的宝石。”
Sora的出现,意味着大模型的竞争到了比拼多模态的阶段。杨植麟和月之暗面的追求也在于此。
2023年之前,杨植麟认为亚洲可能并不存在做大模型公司的机会。但从2022年年底起,杨植麟的判断开始发生变化,因为GPT在美国市场引发很大关注。
如今行业对大模型的议题已从ChatGPT变为Sora,杨植麟表示,多模态过去几年卡在架构上,缺少真正通用的模型,“2024年月之暗面也会推出多模态产品,但公司的目标是在大模型领域做To C超级应用。”
据张通社报道,从商业模式的角度来看,大模型产品分为to B与to C两大阵营。以ChatGPT和Character.ai为例,这两个产品已经积累了大量的数据和用户反馈,有大量的迹象证明已经通过这种产品产生了新的入口,新一代AI在“有用”和“有趣”两个方向上,存在巨大潜力。
月之暗面仍在商业落地的探索中,虽保持着开放的心态,但其核心定位放在to C上。
“AI Native的产品会在to C领域产生新的流量入口,成为AI时代的Super App,这是一个非常大的机会。而要想做Super App,就必须用自研模型,因为只有自研模型才能在用户体验上产生差异化。”
基于这个层面,杨植麟认为,开源模型无法构建产品壁垒,“比如,在海外有几百个基于开源扩散模型Stable Diffusion的应用出现,但最后其实没有任何一个跑出来。其次,无法在开源技术的基础上通过数据的虹吸效应让模型持续地优化,因为开源模型本身是分布式部署,没有一个集中的地方接收数据。”
因此,杨植麟坚定地表示,“不管是从底层逻辑还是当前的现象,都需要通过闭源模型构建产品壁垒。”
浪潮已经被推起,从文生文的ChatGPT,到文生图的DALL·E,再到此次文生视频的Sora,OpenAI每次发布的产品都会引来国内市场的不断追问,我们距离OpenAI还有多远?
据了解,国内目前在大模型领域主要分为两派:一派是以阿里、百度、腾讯、字节为代表的互联网大厂,其所产出的大模型产品多从产业角度出发;另一派是从技术侧入手的创业公司,尤以清华系为重。
在这些从业者眼中,OpenAI是他们一直在追赶但尚未达到的目标。
杨植麟表示,追赶OpenAI的过程需要时间与技术创新,“一方面后发优势可以利用OpenAI等先行者已做出的工作与成功。但客观上需承认,双方差距很大。长期来看,AI是异质化的,不同人面对的AI维度不同。另外,AI模型的自建也不存在超越与否的问题,不同工具在不同场景上的优势也不同。”