人工智能的新业务(以及与传统软件的区别)

   日期:2024-12-28    作者:bynami 移动:http://oml01z.riyuangf.com/mobile/quote/76017.html

原文:https://mp.weixin.qq.com/s/y-GpJsAeE1cdeTNiWE73DA

马丁·卡萨多 ( Martin Casado)和马特 ·伯恩斯坦 ( Matt Bornstein

从技术上讲,人工智能似乎是软件的未来。 人工智能在一系列棘手的计算机科学问题上显示出了惊人的进步,并且软件开发人员的工作正在发生根本性的变化,软件开发人员的在数据上的工作,和源代码上的工作一样多了。

许多AI公司(和投资者)都押注,这种关系将不仅限于技术领域 - AI业务也将类似于传统软件公司。 根据我们与AI公司合作的经验,我们不太确定。

我们坚信AI能够推动业务转型:我们已经将资金投入了这一主题,并且我们将继续在应用AI公司和AI基础设施方面进行大量投资。 但是,我们注意到,在很多情况下,人工智能公司的经济结构与软件业务根本不一样。 有时,它们甚至看起来更像传统服务公司。 特别是,许多AI公司具有

  1. 较低毛利率:由于大量使用云基础架构和持续的人工支持
  2. 规模扩大挑战:由于边缘案例的棘手问题而带来的
  3. 较弱防御护城河:由于AI模型的商品化和数据网络效应带来的挑战。

有趣的是,在AI公司的财务数据中我们看到了一个出乎意料的一致模式,毛利率通常在50-60%的范围内-远低于可比的SaaS业务的60-80%以上的基准。 早期的私人资本可以在短期内掩盖这些效率低下的情况,特别是在一些投资者推动增长而非盈利的情况下。 但是,尚不清楚某一数量的长期产品或走向市场(GTM)优化可以完全解决这一问题。

正如SaaS与本地软件相比引入了一种新颖的经济模式一样,我们认为AI正在创造一种本质上新型的业务 。 因此,本文探讨了AI公司与传统软件公司的不同之处,并就如何解决这些差异分享了一些建议。 我们的目标不是规范性的,而是帮助运营者和其他人了解AI的经济和战略前景,以便他们可以建立持久的公司。

我们注意到,在很多情况下,人工智能公司的经济结构与软件业务根本不一样。有时,它们甚至看起来更像传统服务公司。

软件(包括SaaS)的魅力在于它可以一次生产并多次出售。 该属性创造了许多引人注目的业务收益,包括经常性收入流,高(60-80+)的毛利率,以及(在相对罕见的情况下,如果网络效应或规模效应得以控制) 超线性的规模扩大。 软件公司还具有建立强大的防御性护城河的潜力,因为它们拥有工作所产生的知识产权(通常是代码)。

服务业占据了另一种情况。 每个新项目都需要专门的人员,并且只能出售一次。 结果,收入往往是非经常性的,毛利率较低(30%至50,并且规模扩大在最好情况下也是线性的。 可防御性更具挑战性 - 通常基于品牌或现有客户的控制 - 因为客户不拥有的任何知识产权都不太可能具有广泛的适用性。

人工智能公司越来越多地将软件和服务两者结合在一起。

大多数AI应用程序看起来和感觉都像普通软件。 他们依靠常规代码执行诸如与用户交互,管理数据或与其他系统集成之类的任务。 但是,应用程序的核心是一系列训练的数据模型。 这些模型理解图像,转录语音,生成自然语言并执行其他复杂任务。 维护它们有时会感觉更像是服务业务 – 需要大量的、针对特定客户的工作和投入成本,而这些成本却超出了典型支持和成功的职责。

这种动态变化以多种重要方式影响着AI业务。 在以下各节中,我们将探讨 - 毛利率,可扩展性和可防御性。

越来越多的AI公司似乎在毛利率,可扩展性和可防御性上将软件和服务的要素结合在一起,这可能完全代表一类新的业务。

在内部部署软件的旧时代,交付产品意味着淘汰和运输物理介质 - 无论是在服务器还是台式机上运行软件的成本均由买方承担。 如今,在SaaS的主导下,该成本已被推回给供应商。 大多数软件公司每个月都要支付大量的AWS或Azure账单 - 软件要求越高,账单就越高。

事实证明,人工智能的要求很高

  • 训练一个AI模型可能会花费数十万美元(或更多)的计算资源。 尽管将其视为一次性成本很诱人,但重新训练已被视为一项持续的成本,因为供给AI模型的数据会随着时间而变化(这种现象称为“数据漂移”)。
  • 与运行传统软件相比, 模型推断 (在生产中生成预测的过程)在计算上也更加复杂。 与从数据库中读取数据相比,执行一连串的矩阵乘法正好需要更多的数学运算。
  • 与传统软件相比,人工智能应用更有可能在图像,音频或视频等富媒体上运行。 这些类型的数据消耗的资源比通常的存储资源高,处理成本高,并且经常遇到关注区域问题 - 应用程序可能需要处理一个大文件才能找到相关的小片段。
  • 已经有AI公司告诉我们,与传统方法相比, 云计算操作可能更复杂,成本更高,尤其是因为没有好的工具可以在全球范围内扩展AI模型。 结果,一些AI公司必须定期在云区域之间转移训练的模型 - 花费大量的进出成本 - 以提高可靠性,延迟和合规性。

总而言之,这些效力贡献了AI公司经常在云资源上花费的收入的25%或更多。 在极端情况下,处理特别复杂任务的初创企业实际上发现手动数据处理比执行经过训练的模型便宜。

可以通过专用AI处理器的形式来提供帮助,这些AI处理器可以更有效地执行计算,优化技术(例如模型压缩和交叉编译)可以减少所需的计算数量。

但是尚不清楚效率曲线的形状。 在许多问题领域中,需要成倍增长的处理和数据来获得越来越高的准确性。 就像我们之前提到的,这意味着模型的复杂性正以惊人的速度增长,并且处理器不太可能跟上。 摩尔定律是不够的。(例如,自2012年以来,训练最先进的AI模型所需的计算资源增长了300,000倍,而NVIDIA GPU的晶体管数量仅增长了约4倍)分布式计算是解决此问题的有力方法,但主要解决速度问题,而不是解决成本问题。

人工参与系统有两种形式,这两种形式都会导致许多AI初创公司的毛利率降低。

第一:训练当今大多数最先进的AI模型涉及到手动清理和标记大型数据集。 这个过程费力、昂贵,并且是更广泛采用AI的最大障碍之一。 另外,如上所述,一旦部署了模型,训练就不会结束。 为了保持准确性,需要不断捕获、标记新的训练数据,并将其反馈到系统中。 尽管诸如漂移检测(drift detection)和主动学习(active learning)之类的技术可以减轻负担,但传闻数据显示,许多公司在此过程中的支出高达收入的10-15(通常不计入核心工程资源,并且表明正在进行的开发工作超出了典型的错误修复和功能增加。

第二:对于许多任务,尤其是那些需要更多认知推理的任务,人类通常会实时插入AI系统。 例如,社交媒体公司雇用了数千名人工审核员来增强基于AI的审核系统。 许多自动驾驶汽车系统都包括远程操作员,大多数基于AI的医疗设备都与作为联合决策者的医生进行交互。 随着越来越多的现代AI系统的能力被理解,越来越多的初创公司正在采用这种方法。 计划出售纯软件产品的许多AI公司越来越多地将服务能力引入内部,并预定相关成本。

随着AI模型性能的提高,对人工干预的需求可能会下降。 但是,不太可能将人类完全淘汰。 无人驾驶汽车等许多问题过于复杂,以至于无法通过当前的AI技术实现完全自动化。 安全、公平和信任的问题也需要人为监督,这一事实很可能已体现在美国、欧盟和其他地区当前正在制定的AI法规中。

随着AI模型性能的提高,对人工干预的需求可能会下降。但是,不太可能将人类完全淘汰。

即使我们最终实现了某些任务的完全自动化,也尚不清楚由此可以提高多少利润。 AI应用程序的基本功能是处理输入数据流并生成相关的预测。 因此,运营该系统的成本是所处理数据量的函数。 一些数据点(data points)由人工处理(相对昂贵,而其他数据点则由AI模型自动处理(希望更便宜)。 但是每个输入都需要被处理,以一种或另一种方式。

因此,到目前为止,我们已经讨论了两类成本,即云计算和人工支持。 减少一个往往会导致另一个增加。 这一方程式中的两个因素都可以被优化,但没有一个可能达到与SaaS业务相关的接近零成本水平。

对于AI公司而言,知道何时能找到适合市场的产品比传统软件要难得多。 容易想到您已经达到这种状况了 - 尤其是在拒绝5-10个大的客户之后 - 只看到了ML(机器学习)团队的积压工作开始膨胀,客户部署计划开始不堪重负,从而资源无法支持新销售。

在许多情况下,罪魁祸首是边缘案例。许多AI应用程序都有开放式界面,并且可以处理有噪声的非结构化数据(例如图像或自然语言)。 用户通常对产品缺乏直觉,或更糟糕的是,假定产品具有人类/超人类的能力。 这意味着边缘案例无处不在:我们研究的AI产品的预期功能的多达40-50%可以在用户意图的长尾范围内。

换句话说,用户可以 - 并将 - 把几乎所有内容输入AI应用程序。

用户可以 - 并将 - 把几乎所有内容输入AI应用程序。

处理这个巨大的状态空间往往是一件繁琐的事情。 由于可能的输入值范围如此之大,因此每个新的客户部署都可能生成从未见过的数据。 即使是看起来相似的客户(例如,两家汽车制造商都在进行缺陷检测)也可能需要实质上不同的训练数据,这是因为将视频摄像机放置在装配线上很简单。

一位创始人称这种现象为AI产品的“时间成本”。 她的公司在每个新的客户导入开始时都会进行专门的数据收集和模型微调。 这使他们可以查看客户数据的分布,并消除了部署前的一些边缘案例。 但这还带来了成本:公司的团队和财务资源被捆绑在一起,直到模型准确性达到可接受的水平。 训练周期的持续时间通常也是未知的,因为通常没有什么选择可以更快地生成训练数据……无论团队如何努力。

人工智能初创公司通常最终会花费比预期更多的时间和资源来部署其产品。 提前识别这些需求可能很困难,因为传统的原型设计工具(例如模型,原型或Beta测试)往往只覆盖最常见的路径,而不能涵盖边缘案例。 与传统软件一样,在最早的客户群中,该过程特别耗时,但是与传统软件不同,该过程不一定会随着时间的流逝而消失。

伟大的软件公司围绕强大的护城河而建。 最好的护城河是像网络效应、高交换成本和规模经济一样的强大的力量。

所有这些因素对于AI公司也是可能的。 可防御性的基础通常是由技术上优越的产品而形成的,尤其是在企业中。 作为第一个实现复杂软件的公司,可以带来很大的品牌优势和几乎排他的时期。

在AI世界中,很难实现技术差异化。 新的模型架构主要是在开放的学术环境中开发的。 可以从开源库中获得参考实现(预训练的模型,并且可以自动优化模型参数。 数据是AI系统的核心,但通常由客户拥有,在公开领域或随着时间的流逝成为商品。 随着市场的成熟,其价值也逐渐下降,并且网络效应相对较弱。 在某些情况下,我们甚至发现与供给AI业务的数据相关的规模不经济 。 随着模型变得更加成熟(如“ 数据护城河的空头承诺 ”所述,每种新的边缘案例解决成本都越来越高,同时为越来越少的相关客户提供价值。

这并不一定意味着AI产品的防御性要比其纯软件产品低。 但是,对于人工智能公司而言,护城河似乎比许多人预期的要浅。 从可防御性的角度来看,人工智能在很大程度上可能是一个通向潜在产品和数据的途径。

这并不一定意味着AI产品的防御性要比其纯软件产品低。但是,对于人工智能公司而言,护城河似乎比许多人预期的要浅。

我们认为,人工智能公司要取得长期成功,关键是要应对挑战,并充分利用服务和软件的优势。 秉承这种精神,创始人可以采取许多步骤来使新的或现有的AI应用程序蓬勃发展。

尽可能 消除 模型复杂性  我们已经看到,在每位客户训练一个唯一模型的初创公司与能够在所有客户之间共享一个模型(或一组模型)的初创公司之间,COGS存在巨大差异。 “单一模型”策略更易于维护,更快地推向新客户,且支持一个更简单、更高效的工程组织。 它还趋向于减少数据流水线的蔓延和重复的训练运行,重复的训练运行可以显著提高云基础架构的成本。 虽然没有达到理想状态的灵丹妙药,但关键之一是达成协议之前要尽可能多地了解您的客户及其数据。 有时候,很明显,新客户会为您的ML工程工作带来巨大的负担。 在大多数情况下,更改会更加细微,仅涉及少数几个独特的模型或进行一些微调。 做出这些判断(权衡长期经济健康与近期增长)是AI创始人面临的最重要工作之一。

仔细选择问题领域(通常是狭窄范围,以降低 数据复杂性  从根本上说,使人工劳动自动化是一件很难的事。 许多公司发现AI模型的最小切实可行的任务比他们预期的要窄。 例如,有些团队发现在电子邮件或职位发布中提供简短的建议很成功,而不是提供通用的文本建议。 CRM领域的公司已经发现,基于AI的只关于更新记录,可以为AI找到非常有价值的市场定位。 像这样的一大类问题,人类很难执行,而AI则相对容易。 它们往往涉及大规模,低复杂度的任务,例如审核,数据输入/编码,转录等。专注于这些领域可以最大程度地减少持续性边缘案例带来的挑战,换句话说,它们可以简化供给人工智能开发过程的数据。

我们认为,人工智能公司要取得长期成功,关键是要应对挑战,并充分利用服务和软件的优势。

计划高可变成本。 作为创始人,您应该为您的业务模型(business model)提供可靠,直观的思维框架。 这篇文章中讨论的成本可能会变好(降低一定幅度,但假设它们将完全消失(或非自然的强制)将是错误的。 相反,我们建议考虑在较低毛利率的情况下建立业务模型和GTM战略。 给创始人的一些好的建议:深刻理解供给模型的数据的分布。将模型维护和失效人工接管视为首要问题。 跟踪并衡量您的实际可变成本(不要让它们隐藏在研发中)。 在您的财务模型中做出保守的单位经济假设,尤其是在筹款期间。 不要等待规模扩大或外部技术进步来解决该问题。

拥抱服务。 有巨大的机会来满足它所在的市场。 这可能意味着要提供全栈翻译服务而不是翻译软件,或者提供出租车服务而不是出售自动驾驶汽车。 建立混合业务比纯软件更难,但是这种方法可以提供对客户需求的深刻洞察,并产生快速发展的,市场定义的公司。 服务也可以成为启动一家公司的走向市场(go-to-market)引擎的绝佳工具 - 相关更多信息请参阅这篇文章 - 特别是在销售复杂和/或全新技术时。 关键是要以一种坚定的方式追求一种策略,而不是同时支持软件和服务客户​​。

计划技术堆栈中的改变。 现代AI仍处于起步阶段。 帮助从业人员以高效和标准化的方式完成工作的工具现在正在被构建。 在接下来的几年中,我们希望看到工具的广泛使用,以使模型训练自动化,提高推理效率,标准化开发人员工作流以及监控和保护生产中的AI模型。 通常,作为软件公司要解决的成本问题,云计算也越来越受到关注。 将一个应用程序紧密耦合到当前的工作方式,可能会在导致将来在体系结构上的劣势。

用老式的方法建立可防御性。 虽然尚不清楚AI模型本身 - 或其底层数据 - 是否会提供长期的护城河,但好产品和专有数据几乎总能建立良好的业务。 人工智能为创始人提供了解决旧问题的新视角。 例如,人工智能技术通过简单地表现出更好的性能,在相对冷清的恶意软件检测市场中已经产生了新的价值。 在最初的独特产品功能之上构建粘性产品和持久业务的机会是永恒的。 有趣的是,我们还发现有几家AI公司通过有效的云战略巩固了自己的市场地位,类似于最新一代的开源公司。

* * *

总结一下:从传统意义上讲,当今大多数AI系统都不是完全软件。 结果,人工智能业务看起来并不完全像软件业务。 它们涉及持续的人力支持和重大可变成本。 他们通常没有我们想要的那么容易扩大规模。 强大的防御能力(​​对于“一次制造/多次出售”软件模型至关重要)似乎并不是免费到来的。

这些特征在某种程度上使AI感觉像服务业。 换句话说,您可以更换服务公司,但不能(完全)更换服务。

信不信由你,这可能是个好消息。 诸如可变成本,规模扩大动态和防御护城河之类的事物最终由市场决定 - 而不是单个公司。 我们在数据中看到不熟悉的模式,这一事实表明AI公司确实是新事物 - 进入新市场并创造大量机会。 已经有许多伟大的AI公司成功地在思想迷宫中航行,并制造出性能始终如一的产品。

诸如可变成本,规模扩大动态和防御性护城河之类的事物最终由市场决定 - 而不是单个公司。我们在数据中看到不熟悉的模式,这一事实表明AI公司确实是新事物 – …

人工智能仍处于从研究课题到生产技术的过渡的早期阶段。 很容易忘记,可以说引发了当前AI软件开发浪潮的AlexNet是不到八年前发布的。 智能应用程序正在推动软件行业向前发展,我们很兴奋将看到下一步它们向哪发展。

资料来源:传统软件的毛利率估计是基于publiccomps.com上列出的一些公司得出的 服务公司的毛利率估算基于1万份申报 人工智能业务的毛利率估算基于对人工智能初创公司创始人的几次采访。

 

英文原文链接:https://a16z.com/2020/02/16/the-new-business-of-ai-and-how-its-different-from-traditional-software/?from=groupmessage&isappinstalled=0


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号