精选 | 2024 生成式 A I 的人机交互浪潮

2024-11-18 09:49

爆米花独角兽

2024-11-18 09:49

来源链接

订阅此专栏

收藏此文章

本文由爆米花独角兽独家翻译

前言

构建成功的生成式人工智能（GenAI）解决方案需要技术专长、商业敏锐度和战略眼光的结合。一个理想的生成式人工智能初创公司的创始团队通常包含多样化的技能和背景组合，以应对人工智能技术所带来的多方面挑战。

其他精选系列

《精选|人工智能报告》

《精选 | Anthropic CEO 长文致敬 AI 化学诺贝尔奖得主》

01.

提高智能的可访问性

在技术和人工智能领域，我们正见证着人类与机器互动方式的深刻转变。这一转变主要由生成式AI（Gen AI）的出现所推动，正在塑造人机协作的一个重要转折点。直到现在 ,人类为了利用软件自动化的益处 ,大多需要适应机器 / 计算机的交互方式。

借助生成式AI，我们突然拥有了让机器从以往的用户体验范式中进化出来，并更贴近人类互动方式的力量。我们认为，许多传统的软件用户界面构建可能会很快消失，因为我们将开始看到更加动态、高度个性化且完全情境感知的应用程序界面，这得益于多种感官交互。我们正朝着真正的人机协作和共同创造伙伴关系迈进，这是前所未有的。

在本文中，我们首先回顾历史。这不是第一次平台转移，因此通过回顾之前的浪潮来推断潜在趋势将有助于我们对未来做出更好的预测。

接着，我们探讨为什么认为这次浪潮与众不同，并提出一种新的工作解剖学（New Work Anatomy），这反映了生成式AI 有可能彻底改变我们的工作方式。

对于那些希望了解这些应用是如何构建的技术细节的人来说，我们概述了构建Gen AI 应用程序的技术栈的组成部分，包括多模态考量。需要注意的是，这个技术栈是在不断变化的，因此我们在文中描述的技术栈在发布时可能会有显著的变化 ,并且将继续快速演变。

我们关注关键的机会和风险。存在颠覆现有停滞不前的竞争者的机会 ,为建设者提供工具以大幅提升他们的能力，思考解决未来采用生成式AI 的一系列新瓶颈问题，最重要的是，创造新的颠覆性和更高效用户体验，认识到生成式AI 为用户体验设计范式带来的阶跃变化。另一方面，风险包括低估现有竞争者、低估基础模型进步的速度、过度承诺变换器模型架构的能力，以及无法从创造的价值中提取经济收益。

当我们总结这一切时，对未来充满了极大的兴奋。在人类历史上，机器首次展现出作为协作伙伴而非仅仅是服从工具的潜力。这种转变将对人机协作的未来产生重大影响。我们真诚地相信，现在是创办公司的最佳时机。

02.

浪潮成群而来

在海洋学中，一组波浪指的是一组具有相似特征（例如波长、振幅和速度）并且一起朝同一方向行进的波浪。这类波浪组合在开阔海域中常见，波浪通常由风、风暴或地震活动产生。在典型的一组海洋波浪中，通常会有一个波浪比其他波浪显得更大或更有力。

重大的技术变革也呈波浪式发展。每隔10 到 15 年，就会出现一个新的技术阶跃变化，重新设定行业格局，催生大量新岗位和企业的涌现。这些变革允许新玩家进入市场，并迫使现有企业适应新的现实。同时，这些时期也是引入基本标准和协议的关键期，这些标准和协议最终成为技术开发和部署的基础组件，例如HTML、TCP/IP、压缩算法等等。

我们在这里关注的是相对现代的技术浪潮，包括大型机、个人电脑、互联网和移动技术。生成式AI（即我们目前所在的位置）可能是过去五十年中规模最大、最具颠覆性的技术浪潮。

这一模式十分明确：所有先前的技术浪潮都逐步增加了技术的可访问性，并增强了人与机器之间的协作。

大型机浪潮（1950 年代 -1970 年代）：在大型机计算机的早期，昂贵的机器设施被锁在安全的场所，并由一小批精英操作员管理。输出主要通过硬拷贝或最多通过专有的“哑终端”网络分发。尽管如此，这个时代开始为大型企业引入大规模数据处理。然而，使用特点是用户数量相对较少。

个人计算机浪潮（1980 年代 -1990 年代）：台式机和笔记本电脑的计算能力大幅增加，将计算资源从由专门人员管理的集中地点转移到个人用户和企业手中。尽管当时还没有一个易于访问的网络来实现节点间的广泛通信，但这一浪潮牢固地引入了诸如电子表格、文字处理器和图形用户界面等变革性的里程碑创新，促使计算机适应人类的自然交互方式，而不再是像上一波浪潮那样要求人类去适应计算机的交互方式。

互联网浪潮（1990 年代 -2000 年代）：万维网改变了世界，标志着向全球互联的范式转变，彻底改变了信息的访问、共享和消费方式。这个数字时代重塑了我们的社会互动，并促成了即时通讯、电子商务和流媒体的兴起。就人机互动而言，互联网的扩展带来了以用户为中心的设计的巨大创新。虽然互联网在其初期几乎只是一个静态广播媒介，但它迅速演变成一个响应式、情景感知的平台，能够反映用户熟悉的 PC 应用。这得益于 HTML、CSS、JavaScr ipt、AJAX 等一系列新引入的交互技术，这些技术使得许多新兴公司取得了巨大成功。

移动浪潮（2000 年代 -2020 年代）：个人计算机和互联网浪潮不可避免地预示了一个与机器的普遍而持久的关系，以及对网络、其应用和服务的访问，而移动浪潮将这一关系提升到了全新的水平。它使互联网渗透到日常生活中 , 并通过持续连接和基于位置的服务等发展，开启了全新的应用类别。此外 , 移动技术也让许多新兴市场中的首次接触可靠且负担得起的互联网连接成为了可能。

再次，为了创造性地适应人类交互，而不是让人类去适应计算机交互，我们见证了功能上的跃升（例如，触摸界面、早期自然语言处理、通过 GPS 动态设置上下文等）。如同之前的浪潮一样，我们看到了巨大的创新和价值创造 ,数千家初创企业建立了新的标准、协议和专有平台，包括应用商店、开发工具和社会网络。我们又一次向机器适应人类行为的方向迈进了很大一步，而不是继续要求人类去适应计算机的要求。

03.

新的工作模式解析

生成式 AI 很可能会成为我们在上述描述中提到的最具有变革性的浪潮。虽然之前的浪潮在技术和计算基础设施创新方面带来了显著的进展，促进了信息的访问和共享，但生成式 AI 浪潮有望带来更大的颠覆，为我们提供前所未有的智能访问。

直到现在，企业主要依赖劳动专业化——将工作划分为生产系统内的不同任务、角色或流程。更多的专业化意味着更高的僵化性，因此企业为了提高效率而牺牲了灵活性和适应性。生成式 AI 将通过其在整合上下文数据方面的能力彻底改变我们的工作方式，这些数据包括语音（NLP）、音频、视觉（CV )、位置、运动，最终还包括触觉等更多方面。通过将我们的自然智能与人工智能相结合，生成式 AI 可以处理越来越多的人类任务，增强我们的能力，并消除迄今为止一直困扰人类进步的专业化与灵活性之间的权衡。AI 驱动的系统将提供专业化支持，同时人类可以专注于更高层次的任务，如监控、评估和适应。

随着生成式 AI 的采用不断增加，人类将保持对端到端系统的监督，全面管理和改进这些系统，而 AI 将以最高效的方式规划和执行每一个详细任务。人类和机器将协作，使这种共进化具有深远的变革性。人类与生成式 AI 驱动的系统合作，有潜力减少日常任务的单调性、因业务单元孤岛而导致的流程步骤冗余，以及由于更高程度的适应性和灵活性而使企业面对经济变动时的脆弱性。这些效应是累积的。我们对这种变化对整个社会的直接和间接影响感到非常兴奋。

04.

应用堆栈

为了更好地理解市场以及我们看到的关键机会领域如何发展，我们将首先描述一个用于构建生成式 AI 应用的现代技术栈。下一页的图表显示了与之前机器学习（ML）阶段的许多相似之处，但也展示了重大差异。

· 模型架构：传统的机器学习模型如卷积神经网络（CNNs）和循环神经网络（RNNs）是为特定任务设计的，例如图像识别或自然语言处理。

相比之下，生成式 AI 模型如大型语言模型（LLMs）和扩散模型是基于变压器架构（transformer architectures）构建的，并在大量多样化数据上进行训练，使它们能够在多个领域生成新内容。

· 训练方法：传统的机器学习模型通常在经过整理的数据集上进行训练 ,用于特定任务，使用监督学习或无监督学习技术。生成式 AI 模型则在大量未结构化的数据上使用自监督学习方法进行训练。

. 推理：在推理过程中，传统的机器学习模型接收输入数据并生成输出 ,如分类、预测或翻译。生成式 AI 模型则可以根据提示或种子数据生成全新的内容，如文本、图像或音频。这反过来影响了我们现在可以构建的应用程序类型。生成式 AI 应用不仅限于推荐引擎或预测分析，还能实现开放式的內容创作，如撰写文章或创作音乐。

· 编排：虽然传统机器学习中的编排层侧重于简化机器学习工作流程，但生成式 AI 系统的编排层还承担了管理多个大型语言模型（LLMs）、提示工程、实时数据集成、持续学习和治理等额外职责。

在这个堆栈的底部是数据层。这一层涉及数据收集、准备（清理和标准化）和存储。可以说，这是任何 AI 应用中最重要的一部分，因为专有数据和 / 或独特的数据利用方式（独特的数据分类法）可以创建差异化优势。另一方面 , 不当或忽视数据准备可能会引入偏差，或以其他方式影响整个堆栈：垃圾输入导致垃圾输出。不同类型的数据源会被标记化，通过嵌入模型进行处理 , 并通常存储在向量数据库中。

基础设施层包括预训练模型，这些模型可以通过 API 访问专有模型，也可以下载和托管在公司服务器或私有云实例上（甚至最终可以在设备上运行或完全与云端隔离）。这一层涵盖了所有用于支持模型训练和推理工作负载的计算和托管“工具和技术”。根据公司的阶段和规模，不同的选项各有优劣。选项包括超大规模云服务商（如 AWS、GCP）、按需和保证的无服务器服务 ( 如 Mosaic、Lambda），或访问像 OpenAI 和 Azure 这样的捆绑服务。

编排层是将所有组件连接在一起的“胶水”。这一层不仅仅专注于特定任务 , 而是作为一个统一的层。在响应用户查询时，编排层从数据层中提取正确的数据，通过从其他 API 获取的上下文进行丰富，并将聚合的数据与适当的提示和示例组合起来，提交给模型进行推理。对于更复杂的用例，串联顺序 API 调用可能是有益的或必要的。

测试和评估层通常标志着演示应用与生产就绪应用之间的区别。这包括加入验证检查，以确保大型语言模型（LLM）的响应是准确和适当的（取决于应用场景），并确保答案能够高效地交付。通过对不同组件编排进行迭代测试，可以提高输出在不同任务中的可靠性。开发人员可以使用和重用这些模块，从而在用户与应用交互时不必每次都从头创建。

最后，用户界面应用位于堆栈的顶层。这一层是人类与机器之间的交互层，也是我们直观、顺畅地利用分布式智能的接入点。

在所有堆栈层中，尤其是在护栏层内开发生产就绪组件方面，仍有许多创新尚未见到。这些努力和这一波浪潮将创造巨大的价值。我们正在跟踪所有这些进展，但特别兴奋的是，如何在“带有闪烁光标的文本框”之外，进化我们（人类）与下一代技术的互动方式，以充分发挥生成式 AI 的全部潜力。人机界面创新必须远远超越我们自大型机时代以来习惯的方式。通过这样做，我们相信将会有显著的新价值被引入，主要由那些领先于风险规避或“沉睡 ”的现有企业的颠覆性创新型初创公司带来。

05.

关键机会

谁将成为生成式 AI 平台转型的最大受益者仍然是一个开放的问题。虽然现有企业从数据和分发优势中获益，但初创企业和小型企业也有显著的机会变得具有竞争力。这个问题的实际答案是“视情况而定”，因为市场力量在不同行业中有所不同。创新的速度和成本、权力集中度、产品或服务需求的弹性、最低准确度阈值、互连性和数字化渗透率等因素都可能使天平倾向于初创企业。

我们将探讨我们正在积极瞄准的四类机会：

(1) 打破现有企业的沉睡状态

(2) 赋能建设者

(3) 确保生成式人工智能的未来可行性

(4) 全新用户体验

(1) 颠覆沉睡中的巨头企业

在旧金山湾区，与其他所有市场相比，科技行业的就业份额最高（并且远高于美国平均水平²),因此人们很容易忘记，过去十年数字化带来的大部分利益都被少数几个大型行业所占据。只需驱车离开硅谷不远，就能发现大多数行业仍然主要依赖传统的软件系统，有时甚至还在使用笔和纸。

在石油和天然气行业中，工艺工程师每天手动完成危害和安全任务，采用传统的“笔和纸”检查表方法。成熟的制造软件供应商仅提供本地部署（其中许多正在缓慢地向云迁移），并对每个新版本收费，而新版本通常只是比前一版稍快一点，以证明升级的合理性。这些过时的系统用于设计、测试和建造所有物理产品，从我们坐的家具到复杂的汽车组装。问题不仅在于旧系统和数据孤岛，还在于我们完成工作的方法，涉及许多不同步的专业人士。不同部门和团队之间存在显著的沟通和理解不足。结果，技术兼容性问题、沟通障碍（术语不同和使用行话）、操作孤岛以及组织内部缺乏标准等问题频现。错误经常发生，冗余成为常态，进度不断被延误。

但情况不必如此。借助直观的 AI 驱动解决方案，初创企业有机会彻底改变这些行业的运作方式。由于沉没成本的考虑和重构遗留系统的恐惧，现有企业远不太可能迅速采取行动。他们更有可能进行渐进式创新，专注于增加 AI 功能，而不是真正从头开始构建 AI 驱动的解决方案。

让我们以硬件软件为例。在过去 50 年里，像西门子、达索和欧特克这样的公司建立了 CAD 和 PLM 帝国。然而，他们的竞争能力正受到新技术的挑战，这些新技术包括云技术、高性能计算硬件和生成式 AI，同时还有来自 SpaceX 和 And uril 等绿地硬件公司的需求变化。换句话说，传统的软件公司无法跟上这些新硬件公司的步伐和独特需求，从而拖慢了它们的进展。生成式 AI 可以改变这一点。

生成式 AI 驱动的软件可以通过减少工程师设计和模拟新产品线所需的时间和成本来提供单个用户的利益。然而，更大的机会在于超越个人时间节省，当多用户功能和协作（人机协作和机器间协作）被采纳时才会显现。目前，设计工程师需要排队等待他们的设计蓝图在昂贵的仿真引擎（基于物理和功能设计）上进行测试。借助生成式 AI 驱动的解决方案，不仅单个设计师可以生成更多版本的设计，还可以更快地进行仿真并继续下一步。

此外，如果一个生成式 AI 驱动的设计引擎能够直接与一个生成式 AI 驱动的仿真引擎通信（而不必经过多次人工审查），设计周期时间将大幅缩短，将设计准备好进行原型制作所需的人工努力也会减少一个数量级。进一步地，随着下游采购数据被纳入设计反馈，生成式 AI 驱动的设计引擎的回报率（ROI）将进一步扩大。通过这种方法，不仅可以从机械角度实现最优设计，还可以从供应链角度实现最优设计（例如，了解选择某种材料或公差可能会对可合作的供应商数量及其收费标准产生何种影响）。这种方法确保从第一步起就融入了正确的制造设计（DFM）原则。

受我们新的工作解剖学启发，我们认为不久之后，硬件制造商将与一位由 AI 驱动的软件增强的“流程指导”工程师合作，而不是与十位设计和仿真工程师合作。抓住这一机会的初创企业有很大的机会与现有企业拉开距离，因为现有企业很难从当前依赖于多个用户许可的商业模式中转变。AI 驱动的新进入者不需要在每个用户许可层面进行竞争，因为他们有潜力吸引更大的预算用于招聘人员。

尽管存在挑战，初创企业应记住，虽然现有企业在创新方面可能较为缓慢，但他们在硬件软件市场上仍然占据着强势地位。许多企业客户已经投入大量资金将产品套件集成到他们的组织中，并培训了他们的员工，因此一个只能作为点解决方案增加价值的更好产品实际上并不值得他们更换。创始人在考虑他们的初始理想客户画像（ICP）并随着平台能力的扩展而扩展定义时，应将这一点纳入考虑。进一步解释，虽然初创企业可能一开始通过提供一个补充现有产品（如 SolidWorks）的点解决方案来吸引客户，但这不足以解锁风投规模的增长。在某个时候，初创企业将不得不直接竞争，以创造更大的价值并赢得市场份额。

另一个陷阱是初创企业从其宏伟愿景太远的地方开始，这条路径需要太多步骤（和太多的“如果”）才能达到相关性，从而降低成功的可能性并影响投资者对机会的评估。例如，一家公司首先创新设计审查过程作为质量管理的一部分，然后创建一个更全面的 QA/QC 工具，最后才向上游推进到生成式设计 ,可能会发现自己面临一条过长的路径，难以达到相关性。我们认为，最初的立足点应该明显提升初创企业在设计领域从一开始就获胜的能力，而不仅仅是多个独立事件的简单叠加，这样会导致成功概率非常低。

生成式 AI 颠覆传统行业的案例不仅限于硬件设计和制造。其应用有潜力为个体员工提供单人效益，并在建筑、物流、法律和保险等多个行业的不同职能之间提供多人协作价值。一个值得关注的领域将是AI 代理驱动的服务与人力驱动的服务和传统软件解决方案的竞争。这种潜力在于捕获比现有企业更大的可寻址市场。

许多公司传统上将法律、会计和客户服务等功能外包给第三方服务提供商，这些提供商并未使用 AI 增强。这些服务企业历来面临扩展挑战，因为它们必须雇佣更多的人来服务更多的客户。而在 AI 增强的服务提供商的情况下，扩展挑战消失了，因为 AI 可以处理以前由一组熟练工人完成的工作。

当我们考虑那些在传统软件产品的支持下被内部吸收的功能时，这一逻辑同样成立。提供 AI 代理驱动服务的初创企业极具吸引力，因为它们能够捕捉到巨大的潜在市场。鉴于这些公司不仅有机会增强人类工作者（如同以往的软件解决方案所做的那样），还有机会减少完成工作所需的人数，因此它们的市场捕获范围不仅限于行业的软件支出，还扩展到了年度劳动力支出。正如下面的图表所示，领先的网络安全解决方案提供商 Palo Alto Networks 每年的收入约为 80 亿美元。然而，他们的客户每年在内部安全专家上的支出高达 3750 亿美元。一个不仅简化或增强安全员工工作流程，还能通过执行部分任务减少总安全员工数量的 AI 代理驱动的网络安全解决方案，有机会捕获这部分人力成本——这是一个更大规模的潜在可寻址市场。

(2) 赋能建设者

对完美准确性的追求，通常被视为先前几波 AI 浪潮中的首要目标，已成为寻求完全自主的企业的一大障碍。这一目标要求大量的人工干预，导致这些企业的员工人数众多且利润率低下。因此，早期展示快速增长的 AI 初创企业在演变为健康企业方面遇到了困难。这使得 AI 主要惠及了能够负担大量计算资源和人才投资的大科技公司，从而克服了 AI 臭名昭著的“最后一公里”问题。

新兴的生成式 AI 应用浪潮有望摆脱这些雄心勃勃且昂贵的要求。新时代强调构建能够随着用户参与而不断改进的应用，这些应用不需要 100% 的准确性就能发挥作用。通过访问预训练的模型并为迭代性质的用例（如新产品设计）构建解决方案，初创企业不再需要承担从零开始构建模型并用一支 sophisti cated 的数据科学家和机器学习工程师团队进行完美训练的成本。现在，开发者和业务专业人士可以利用 AI 能力构建客户所需的产品，识别合适的用例并利用技术推动业务成果。生成式 AI 促进了更广泛劳动力的参与，而不仅仅是少数精英专家的领域。

软件开发者的 talent pool 远远大于机器学习专家。为前者提供构建以 AI 为中心的应用程序的能力是一个巨大的机会。虽然访问预训练模型消除了软件创新的一个重要障碍，但我们还需要更多高性能模型以外的东西才能将应用程序投入生产。开发者需要专门构建的、用于持续生产工作流程的强大基础设施和工具。这些工具必须以开发者熟悉的方式导航和简化运行和维护 ML 系统的复杂性。使用主流语言工具、统一的 API 和代码仓库来访问这些系统，将是成功公司的特征。

另一方面，开发者不熟悉的 AI 元素（如数据管道的创建和管理）应该完全自动化，理想情况下是由专门为这些工作流设计的 AI 代理提供支持。一个明确的机会是为软件开发者提供基础设施和工具，使构建 AI 应用程序类似于他们习惯的工作方式。这样一来，没有时间和资源建立机器学习实践的企业只需几名内部软件开发者就能享受到生成式 AI 的好处。因此，生成式 AI 的覆盖范围和对 AI 驱动解决方案的需求可以在更广泛的经济中得到满足和扩展。

机器人技术是另一个需要基础设施抽象的引人注目的行业。有限的专家池花费无数天和周时间编程新的机器人，然后又花费更多时间部署和维护它们。工具分散，一切都是定制构建的，解决每一个独特案例都需要深厚的技術專長。为了满足日益增长的机器人和自动化需求，我们需要公司把这些复杂性抽象成可以通过 API 或其他等效方式访问的综合构建块。成功的企业有机会成为编程机器人的标准操作系统，被更广泛的普通软件开发者群体所利用。

挑战依然存在，因为好的模型需要由好的数据驱动。对于一个新的基础设施公司来说，获得高质量（通常是专有的）数据以向客户展示有意义的投资回报率并非易事。冷启动问题确实存在。最初你没有任何数据，你需要赢得客户的信任以获得他们最有价值的资产的访问权限，即使成功了，不同客户的数据实践也会有所不同。

我们认为，创始人必须找出如何在不向客户索取过多的前提下建立信任并展示其解决方案的价值，同时避免陷入定制构建的陷阱，这些定制构建往往难以规模化。为此，创始人可以从大幅缩小其理想客户画像开始。

在软件开发的历史中，一直有一种向更高层次抽象发展的趋势，例如高级编程语言、向云的迁移、分布式系统和开源库。我们预计这一趋势将继续并加速，将软件工程师的日常工作从执行客户需求和进行性能优化转变为确保由生成式 AI 驱动的开发按预期运行。这一转变标志着向一种新的工作解剖学（New Work Anatomy）的明确转变，这一变化已经在进行中，现在因生成式 AI 而大幅加速。

(3) 生成式人工智能的未来可行性

生成式 AI 将在所有商业领域推动重大创新，包括但不限于媒体、医疗保健和娱乐。其创造内容、模拟场景和自动化复杂任务的非凡能力突显了其变革潜力。同时，在考虑规模化时，也出现了许多问题。有机会创建新的框架，以确保以伦理方式实现弹性和效能。

“幻觉是一个特点，而不是一个 bug”

“幻觉是一个特点，而不是一个 bug”这句话捕捉了变压器工作方式的一个重要后果。幻觉不是可以快速修复的 bug，而是当前生成过程固有的一个特点。生成式 AI 应用程序建立在一个概率引擎上，而不是像传统软件那样的确定性引擎。微调有助于减少模型输出中的幻觉，因为它会更重视训练过程中识别的期望输出，并调整模型的内部参数。然而，这并不意味着幻觉的概率会降至零。在一些创意领域，如写作、头脑风暴甚至问题解决中，这是完全可以接受的。但在医疗保健、法律和教育等领域，对不准确结果的容忍度为零。尽管我们通常更喜欢从处理迭代性质的创意用例开始的初创企业（后续章节将详细介绍），我们也发现有新的机会让初创企业提供防护措施，以便更好地管理模型的幻觉。

新的工具来管理幻觉必须满足新 AI 建设者的需求。即使是大型、 sophistica ted 的软件公司在构建生成式 AI 应用程序时，也 struggle with model test ing（参见 The Stack）。他们的许多模型选择或模型组合往往依赖于猜测和直觉，因为他们并不真正知道哪些更改能改善产品的质量，以及这种改善的具体程度。

问题不在于 AI 模型和系统没有现有的评估方法，事实上，评估一直是核心机器学习工作流程的一部分。然而，这些指标并不适合那些不感兴趣深入理解这些指标的软件开发者，他们更关心的是准确捕捉业务案例。此外，传统的现成评估方法是一种“一刀切”的解决方案，因为什么是好的输出是主观的 , 并且特定于具体的用例。我们认为，在这个领域构建产品的创始人应该思考如何抽象评估指标，使其对普通软件开发者来说更加直观。他们还可能需要考虑如何创建一个可扩展的评估过程，因为为每个测试实例生成独特的评估数据集是一项巨大的工作。

随着 AI 渗透到我们经济的每一个部分，从其不可预测性中受益的新机会将会出现。在 AI 作为协作力量的情况下，公司可以提供高度个性化的客户体验，最优地满足许多细分市场的具体需求。随着越来越多的责任被交给多个 AI，将会有越来越大的需求来管理和监督这些 AI，以确保所有暴露给客户的內容是安全的，并且生成的输出符合公司指南。这一需求可以扩展到许多用例和许多行业；机会是巨大的。

挑战仍然存在，因为我们仍处于这一周期的早期阶段。AI 被纳入经济的各个方面不是会不会发生的问题，而是何时会发生的问题。然而，过早进入市场 , 在需求尚未显著增长之前试图管理大规模的 AI，几乎等同于错误。我们已经了解到，即使管理大规模 AI 的未来问题对客户来说是清晰的，但如果他们还没有实际感受到这种痛苦，解决问题就不会成为优先事项。因此，深入的客户发现和精明的市场进入策略，以提供客户当前所需的價值，是至关重要的。

(4) 全新用户体验

过去五十年的技术创新一直朝着创造更创造性地适应人类交互的机器方向发展，而不是强迫人类适应机器的要求。我们看到这一趋势随着生成式 AI 的加速发展达到了前所未有的速度，生成式 AI 使全新的用户体验成为可能，这些体验具有沉浸感、个性化和直观地符合人类行为的特点。我们目前的大部分注意力都集中在这里，因为我们相信，拥抱实时、自适应和环境接口的公司可以为技术与体验创新的新时代奠定基础。这不再是关于 Transformer 模型和训练的问题；实际上，甚至不仅仅是关于推理工作负载的问题。

下一代的行业巨头将包括那些大胆创新和变革用户体验的公司，它们充分利用生成式 AI 平台转变的巨大潜力。我们都知道数据是新的石油。

但是，当所有模型都在同一个庞大的数据源——万维网上进行训练时，会发生什么？我们已经看到了某种程度上的模型能力和输出的同质化现象。如果基础数据是普遍可访问的，公司如何实现差异化？有几个不同的途径，从新的模型架构到使用 AI 助手的用户体验改进。我们认为，一个“厚”用户体验层，由专有的交互数据组成，并结合超出基于人类反馈的强化学习（RLHF）的进展和一系列 API 调用，将创建动态的产品体验，这些体验能够根据每个个体的需求和偏好进行调整。

另一个差异化的来源将来自于新的数据，这将对相关硬件和其他传感器平台的发展产生重要影响。为了捕捉更多实时、情境相关的信息，我们需要从传统的设备和传感器形态中进化。智能手机虽然智能且配备了多种传感器，但其当前的形态并不适合用于环境、始终开启的现实世界数据捕获。我们在 AR /VR 设备和 AI 耳钉等领域的许多实验正是这一事实的证据。

2022 年让我们眼前一亮的智能聊天 GPT 机器人界面是一种合理且用户友好的与 AI 交互的方式。然而，当我们考虑知识工作者和 AI 在商业中的应用场景时 , 聊天机器人界面忽略了太多未开发的用户体验机会。

在当前的经济中，成为一名知识工作者变得越来越动态。一方面，个人仍然需要在一天中完成大量手动任务，如处理电子邮件、确定订单报价以及在数据库中输入和输出数据。与此同时，干扰无处不在，保持专注总是充满挑战。知识工作者试图在内容的指数级海洋中导航， 但人类的认知能力并不足以应对这种挑战。我们继续前进，使用过时且熟悉的 workflow，尽管周围的世界已经因为 AI 的变化而不同。

使软件有价值的是其释放人类时间的潜力。它使我们能够重新分配这一宝贵资源，以扩大我们的产出，并在相同的时间内完成比否则更多的工作。我们无需过多思考就能完成的事情越多，社会的进步就越快。我们尝试将这种“ 时间的生成”描绘为人类与机器交互和进化的结果，如下所示，其中原始人力努力与增强的协作努力之间的差距将继续扩大，对过程经济学产生相应的影响。

那么，AI 软件的未来会是什么样子呢？集成的 AI 代理网络将为我们完成任务 , 而无需每次都被明确编程来执行这些任务，而视觉（及其他）环境界面将帮助确定如何及何时适应，以确保我们保持专注。我们的软件将理解我们，不一定要求我们必须学习如何使用它。我们将不再需要记住每一个键盘快捷键，甚至可能不需要记住使用哪种软件。数据输入字段、菜单和许多传统的软件用户界面构造可能会消失。我们将开始看到更加动态的应用程序界面，远离我们过去五十年所熟知的半静态、高度结构化的界面。有些界面或许根本没有视觉方面，因为我们继续在利用音频、语音、超光谱 / 超听觉甚至触觉感官交互方面进行创新。

这就是生成式 AI 的不同之处。在之前的科技浪潮中，软件专注于标准化工作流程以实现规模化，而作为人类，我们必须适应这些标准，以获得自动化的益处。而在 AI 软件中，我们不再需要适应一种通用的技术交互方式来完成特定任务。相反，这一波以 AI 为中心的软件通过高度个性化的体验，使非标准化工作流程和过程自动化成为可能。我们正在积极从人类适应机器要求（如输入、输出、交互机制和模式）转向机器适应人类要求（如“环境”计算、新的设备形态、多模态输入和表达）。

AI 和物联网 / 边缘计算的突破，加上能够读取屏幕以获取完整上下文并理解多模态数据输入的代理，是新一代软件范式演进的关键特征，这种范式能够深刻且环境化地理解人类意图。这一代新的工具和系统将具备创建个性化体验的能力，通过自适应界面展示有用的信息，隐藏无关的信息，并尽可能地自动化任务。作为人类，我们将更多地扮演协调者和战略家的角色（我们的新工作解剖学），拥有更多时间和自由来专注于我们仍然擅长的事情。

挑战仍然存在。最大的敌人可能是我们自己，因为采用这些新产品需要行为上的改变，这需要克服对 AI 的怀疑 。尽管潜在的生产率提升很大，但旧的习惯很难改变，人们往往会依附于他们现有的工作流程和支持工具。尽管理论上极其有益，但由于我们仍处于这一周期的早期阶段，商业投资回报率（ROI）的案例仍需在大规模应用中得到验证。我们寻找的是那些能够超越传统界限、不害怕对未来提出明确愿景的创始人。在引领人类与机器交互和协作新范式的过程中，坚定的意见和灵活的态度最为重要。

06.

关键风险

在前一节中，我们探讨了生成式 AI 带来的许多机会，强调了其在各个行业的变革潜力。所有机会都伴随着相应的风险，总体而言，我们愿意接受这些风险。然而，当我们考虑风险调整后的回报时，某些领域和条件应该避免。

在这个领域的公司面临的防御性和可持续性的风险因素是多方面的。这些风险包括对第三方平台的过度依赖、在竞争激烈的市场中区分产品的挑战、对仍在变化中的监管环境的依赖，以及伦理失误的深远影响。

薄层应用

对于许多初创企业的应用想法，仅仅在第三方基础模型上添加一层表面功能或定制化可能会使初创企业暴露于多个脆弱性之中。

那些对第三方模型有关键依赖的公司会发现，价值并没有积累到他们自身 ,而是积累到了底层模型上。这种无法从创造的价值中提取经济收益的情况是 problematic 的，因为初创企业可能难以获得能够证明风险投资合理的有意义的利润率。尽管我们是种子轮投资者，但我们始终会考虑到最终的退出策略。

许多例子展示了为什么过度依赖第三方模型或服务可能是危险的，这会使初创企业受制于外部变化，如更新或停止服务。我们亲眼目睹了监管调整、市场变化（以及公司层面的战略灵活性不足）和成本增加如何突然限制或完全否定一家初创企业的增长轨迹。

我们寻找的是构建模型无关架构的创始人，这样当新的模型出现时，他们可以迅速将其核心引擎转移到最适合其特定用例的最佳模型上。在应用程序方面，我们寻求那些在差异化用户体验（UX）和 / 或独特数据方面严格要求的团队，以构建一个厚重的表层（thick veneer）。

一个简短的补充说明：在原型设计阶段坚持使用一个模型（可能是最容易操作的模型）是有道理的。然而，当这个想法变得具体并扩展时，必须考虑超出性能和易用性的成本和延迟因素。

当我们“打开”任何给定应用程序的“引擎盖”时，还有许多其他因素需要考虑。我们特别警惕的一种方法是递归训练，即越来越多地使用 AI 生成的内容作为未来迭代的训练数据。虽然这种方法效率很高，但并不总是有效，尤其是在人机交互环节逐渐减少的情况下。递归训练可能导致错误和偏见的传播，因为 AI 生成数据中的不准确性可能在后续迭代中被强化和放大。此外，训练数据的多样性和质量可能会随时间下降，导致模型变得不那么稳健，更容易在有缺陷的数据模式上过拟合。这一过程最终可能会削弱模型有效地泛化到新、未见数据的能力，损害其可靠性和性能。

被碾压的风险

每个版本的 GPT 都经过训练以在特定能力上超越其前辈。GPT-3 的最大改进在于其问答模型，使其能够提供更准确和连贯的用户查询响应。GPT-4 的突出改进在于其理解和处理不同多模态数据类型（不仅仅是文本）并将其合成结构化格式的能力。虽然撰写本文时 GPT-5 尚未发布，但预期的重点将是改进其推理和代理能力，这将使其能够构建更复杂的模型，并表现出更像人类的决策和行为。

在最近的一次采访中，Sam Altman 清晰地阐述了为什么在特定模型版本上开发利基应用的初创企业面临着被 OpenAI 快速模型进步“碾压”的风险。

假设底层模型不会显著改进的初创企业将迅速变得过时。没有明确差异化策略以应对模型提供商进步的路线图，未来有可能变得劣质或冗余。我们寻找的是那些有明确逻辑说明为什么他们的初创企业将保持竞争力，并且对未来底层基础模型能力提升感到兴奋的创业者。事实上，我们经常问早期创始人是否对 GPT 的后续版本（如 GPT-5）感到兴奋。如果答案是肯定的，这通常表明他们有一个更具防御性的概念，更强大的 GPT 版本会加速而非威胁他们的业务。那些更担心或没有明确答案的人，很可能会被新的 GPT 或模型版本所威胁，这些新版本在功能上扩展并吸收他们的功能。

低估现有企业

虽然《创新者的窘境》阐述了为什么现有企业可以做一切“正确”的事情，但仍可能在新竞争对手崛起时失去市场主导地位，但 AI 平台的转变使这一理论受到了质疑。

与其它行业不同，大型科技公司非常精明。它们拥有熟练的劳动力和系统，能够快速整合新技术。它们在分发、计算和数据方面也具有优势，无论是因为现有的能力还是充足的资金来构建这些能力。在创新是渐进的领域，这些优势倾向于有利于它们。

随着新平台的发展，初创企业不应低估现有企业的品牌声誉、深厚的行业洞察和关系，以及监管或合规经验。虽然我们看到一些现有玩家比以往更加开放地尝试新技术，但许多初步努力很快就会失败。企业需要并希望有一个 AI 战略，但许多企业尚未建立评估新供应商的标准流程。他们通常会涉及研究、合规和 IT 部门，有时还需要一个生成式 AI 委员会才能做出决定。初创企业不应忽视获得客户采用的挑战，也不应低估与已建立供应商之间的信任，即使他们的新产品表现更好。

关键任务

虽然在理论上，支持客户完成关键任务通常代表了 AI 公司最高的投资回报潜力，但在实践中，它们很少能够带来快速的胜利。

生成模型本质上是概率性和随机性的。它们根据输入数据中学到的分布和模式生成输出，而不是基于确定性规则。由于生成输出中固有的不确定性，实现近乎完全的准确性对生成模型来说是一个挑战。虽然在某些情境下这些不完美是可以接受甚至是可取的，但在偏差可能导致负面后果的用例中，生成式 AI 存在严重的局限性。

在客户评估支持其关键任务的供应商时，信任是最为重要的。初创企业必须展示可靠性、安全性和稳健性，而这通常会导致较长的销售周期和昂贵的监管合规认证。市场进入策略需要谨慎导航以克服这些障碍。

将这些解决方案推向市场所需的重大时间和资本投入不容小觑。随着公司的扩张，持续的费用如获取高质量数据和采购高性能硬件将持续存在。

与其从一开始就投身于关键任务用例，我们更倾向于寻找那些最初专注于不需要近乎完美输出精度的应用的创始人。通过这些应用，他们可以积累经验 , 建立业绩记录，并逐步扩展其能力。这使他们能够成熟其 AI 解决方案，并在更复杂的混合模型上线时保持灵活。

结语

在历史上每一次重大的技术革命中，追溯到轮子的发明，机器（无论是物理的还是逻辑的）与人类关系的适应一直是过渡的关键社会经济要素。这些适应通常涵盖了微观层面（人类如何实际与这些机器交互）和宏观层面（广泛的社会和经济影响）。此外，现有企业往往不是暂时就是永久地被颠覆，通常会产生新的经济价值，并在这些生态系统中涌现出新的关键参与者。

我们目前正在经历的创新浪潮可以说是现代史上最具影响力（也可能是最快速的）技术浪潮。就最终影响而言，它无疑可以与工业革命相提并论，并且代表着一种我们从未经历过的人机共同进化。

在 2018 年，我们在 Bee Partners 创造了一个短语，这个短语一直提醒我们这个时代是多么深刻，也成为我们一直以来的座右铭：“机器将胜出”。坦率地说，机器已经在许多方面的人类感知和表现上取得了胜利。在这一前所未有的时期，我们集体做出正确的投资决策的能力将为 HMI（人机交互）设定新的标准和协议，就像我们之前讨论的那些技术浪潮引入了新的标准和协议一样——许多新进入者通过快速创新在市场上积累了巨大价值，而现有企业则在“等待观望”。

我们在这里讨论了新的工作解剖学，这不仅拥抱而且需要与机器的日益共进化和合作，这是鉴于生成式 AI 及其底层模型的进展和加速而不可避免的。新公司和现有企业中那些拥抱这一新现实的将有最好的机会蓬勃发展。那些坚持 legacy 技术、流程和标准的企业，可能在战术上是“安全”的，但在战略上则面临风险。

我们已经概括了四个广泛的关键机会领域，考虑到当前剧烈的变化背景，我们认为这些领域最有可能带来非凡的价值创造。特别是，我们强调了我们认为最被忽视但潜在最具颠覆性的机会领域：即通向生成式人工智能（GenAI ) 的终极下一代人机界面。同样，作为早期投资者，我们概述了四个关键风险领域。这 partly 是由于我们自己的全面研究，但主要是因为我们过去几年观察到的大量 AI 交易流动。

这种关于我们关键机会和关键风险的内部论点的组合，加上对我们可以从先前历史技术革命的行为和结果中学到的教训的真诚致敬，当然指导着我们的投资决策。读者在这里的最终收获应该是，我们对生成式 AI 深远影响的回应 ——在人类历史上，机器首次代表协作而非从属的实体——将对未来几十年的人机交互产生深远的影响。我们坚信，促进社会和产业积极进化的机遇从未如此之大。

07.

附录：关于创始人原型的说明

我们不希望看到的

那些只追逐“当下热门事物”而缺乏未来愿景的创始人。虽然清晰的愿景至关重要，但过度僵化也可能导致失败。人工智能领域正在快速发展,新的进展可能会使以往的方法变得过时。创始人必须足够灵活，能够根据新信息或市场条件的变化调整并适应他们的策略。
那些空想家、梦想家型的创始人，如果他们没有快速部署的坚实记录，也会面临问题。产品交付速度比以往任何时候都更重要。
在选择应用时不够谨慎的创始人也会遇到问题。并非所有任务都能容忍模型产生的幻觉，在那些情况下不使用大型语言模型（LLMs）是可以接受的虽然创始人不需要是首席人工智能科学家，但对人工智能技术，特别是生成式人工智能有一个基本的了解是至关重要的。缺乏技术理解可能导致设定不切实际的目标、做出糟糕的决策，以及难以聘请到合适的人才或与技术团队有效沟通。
人工智能初创公司面临着从数据隐私担忧到技术故障等重大风险。那些未能主动识别、评估和减轻这些风险的创始人可能会发现他们的公司面临本可避免或大幅减轻的危机。

我们所寻找的

对未来的愿景：坚定信念，灵活把握。创始人既要有明确的方案，又要能灵活调整解决方案。
创始人既要懂技术，又要理解良好的增长和分销机制的价值。
创始人要具备在必要时迅速转型的能力，从挫折中学习，并在创业过程中不可避免地起伏中坚持不懈。
那些致力于以道德和有益于社会的方式开发和使用人工智能的人，认识到其技术的广泛影响。
初创公司往往需要跨学科合作，因此团队成员必须能够有效地跨越不同领域和视角进行工作。
与内部团队、投资者、监管机构和客户进行清晰、有效的沟通，对于统一目标和推动采用至关重要。

写在最后

敬请期待。

除此之外，如果在阅读本篇时，略有困难，那是因为您尚未阅读他的前述文章，

第一篇《AI 算法分析 94 家海外 AI 独角兽》，我们分析了 2015 年后成立的 6500 家 AI 公司, 并且整理出了 94 家海外 AI 独角兽。
第二篇团队分析《原创研究 | AI 创业：团队决定命运？》。
第三篇机构分析《AI 投资新格局：科技巨头主导，VC 退居二线》。
第四篇，OpenAI 分析《原创研究 | OpenAI 黑帮使命：从邪恶的 OpenAI 手中拯救人类》。
第五篇中美技术对比《原创研究 | 大国竞争之中美 AI（一）技术篇》。
第六篇中国独角兽分析《大国竞争 | 中美 AI 对比（二）独角兽篇》。
第七篇中国 AI 独角兽点评《人工智能：爆米花独角兽与数字庞氏的交响》。
第八篇国内创业方向分析《大国竞争 | 中美 AI 对比（三）创业方向和人才来源》。

推荐专栏