我们可能即将看到由 AI 开发者创造的第一款「永无止境」的游戏。
撰文:Jonathan Lai,a16z
编译:Nick
早期关于游戏中的生成式 AI 革命的讨论主要集中在 AI 工具如何提高游戏创作者的效率,使得游戏的制作速度比以前更快、规模更大。从长远来看,我们认为,AI 不仅能改变创造游戏的方式,还能改变游戏本身的性质。
一直以来, AI 都在助推产生新形式的游戏。从《Rogue》的程序生成地下城(1980 年)到《半条命》的有限状态机(1998 年),再到《Left 4 Dead》的 AI 游戏总监(2008 年)。最近,深度学习技术的进步使计算机能够根据用户提示和大数据集生成新内容,这进一步改变了游戏规则。
虽然还在早期,但我们已经看到了一些有趣的 AI 驱动的游戏领域,包括生成式智能体、个性化、 AI 叙事、动态世界和 AI 副驾驶。如果取得成功,这些系统可以结合在一起,创造出新兴的 AI 游戏,这些游戏能够留住一堆忠实的玩家。
模拟游戏于 1989 年由 Maxis 的 SimCity 开创,玩家可以在游戏中建造和管理虚拟城市。如今,最流行的模拟游戏是《模拟人生》,全球有超过 7000 万玩家在游戏中管理被称为「模拟人」的虚拟人,让他们过着自己的日常生活。设计师威尔·赖特 (Will Wright) 曾将《模拟人生》描述为「互动娃娃屋」。
生成式 AI 可以通过大型语言模型(LLM)驱动的新兴社会行为,使得智能体更加逼真,从而大大推动了模拟游戏的发展。
今年早些时候,来自斯坦福大学和谷歌的一个研究团队发表了一篇论文,介绍了如何将 LLM 应用于游戏中的智能体。在博士生 Joon Sung Park 的带领下,该研究团队在一个像素艺术沙盒世界中加入了 25 个类似模拟人生的智能体,这些智能体的行为由 ChatGPT 和一种扩展 LLM 的架构来使用自然语言存储智能体经验的完整记录,将这些记忆合成进入更高层次的反思,并动态检索它们以规划行为。
这些结果是对模拟游戏潜在未来的精彩预览。从用户指定的一个建议开始,即一名智能体想要举办情人节派对,智能体们独立地分发派对邀请,建立新的友谊,互相邀请约会,并协调在两天后准时出席派对。
这种行为之所以成为可能,是因为 LLM 是在社交网络数据的基础上训练出来的,因此它们的模型中包含了人类在各种社交环境中相互交谈和行为的基本要素。而在模拟游戏这样的互动数字环境中,这些反应可以被触发,从而创造出栩栩如生的行为。
从玩家的角度来看,最终结果是更身临其境的游戏体验。玩《模拟人生》或殖民地模拟游戏《RimWorld》的乐趣很大程度上来自于意想不到的事情的发生。有了社交网络的智能体行为,我们可能会看到模拟游戏不仅展示出游戏设计师的想象力,还反映了人类社会的不可预测性。观看这些模拟游戏可以像观看下一代《楚门秀》一样,给人们带来无尽的娱乐,而这种娱乐方式是今天的预制电视或电影所无法实现的。
利用我们对「玩偶之家」游戏想象力的渴望,特工本身也可以个性化。玩家可以根据自己或虚构的人物来设计一个理想的特工。《Ready Player Me》让用户可以通过自拍生成自己的 3D 头像,并将头像导入超过 9000 款游戏 / 应用程序中。AI 角色平台 Character.ai、InWorld 和 Convai 可以创建具有自己的背景故事、个性和行为控制的自定义 NPC。
有了自然语言功能,我们与智能体互动的方式也得到了扩展。如今,开发人员可以使用 Eleven Labs 的文本转语音模型为其智能体生成逼真的声音。Convai 最近与英伟达合作推出了一个广为人知的演示,其中玩家可以与 AI 拉面厨师 NPC 进行自然语音对话,并实时生成对话和匹配的面部表情。AI 伴侣应用 Replika 已经允许用户通过语音、视频和 AR/VR 与伴侣交谈。未来,人们可以想象一款模拟游戏,玩家可以在旅途中通过电话或视频聊天与他们的智能体保持联系,然后回到电脑后点击进入更身临其境的游戏。
然而,在我们看到完全生成版的模拟人生之前,还有许多挑战需要解决。LLM 的训练数据存在固有偏差,这些偏差可能会反映在智能体行为中。全天候实时服务游戏运行大规模模拟的成本在经济上可能并不可行,在 2 天内运行 25 个智能体需要花费研究团队数千美元的计算费用。将模型工作负载转移到设备上的努力很有前景,但仍相对较早。我们可能还需要围绕与智能体之间的准社会关系制定新的规范。
但有一点是明确的,那就是目前对生成式智能体的需求巨大。在我们最近的调查中,61% 的游戏工作室计划尝试使用人工智能 NPC。我们认为,随着智能体进入我们的日常社交领域,AI 伴侣很快就会变得司空见惯。模拟游戏提供了一个数字沙盒,我们可以在其中以有趣和不可预测的方式与我们喜爱的 AI 伴侣互动。从长远来看,模拟游戏的性质很可能会发生变化,这些智能体不仅仅是玩具,而是潜在的朋友、家人、同事、顾问甚至恋人。
个性化游戏的最终目标是为每个玩家提供独特的游戏体验。例如,让我们从角色创建开始——从最初的《龙与地下城》桌面游戏到 Mihoyo 的《原神》 ,几乎所有角色扮演游戏(RPG)的支柱都是角色创建。大多数 RPG 允许玩家从预设选项中选择自定义外观、性别、等级等。那么如何超越预设为每个玩家和游戏过程生成一个独一无二的角色呢?将 LLM 与文本到图像的扩散模型相结合的个性化角色构建器可以实现这一点。
Spellbrush 的《Arrowmancer》是一款由该公司定制的基于 GAN 的动漫模型驱动的 RPG 游戏。在 Arrowmancer 中,玩家可以生成一整套独特的动漫角色,包括美术和战斗能力。这种个性化也是其货币化系统的一部分,玩家将 AI 创建的角色导入定制的 gacha 旗帜,在那里他们可以获得重复的角色来加强他们的队伍。
个性化还可以延伸到游戏中的物品。例如,AI 可以帮助生成只有完成特定任务的玩家才能获得的独特武器和盔甲。Azra Games 建立了一个由人工智能驱动的资产流水线,可以快速构思和生成大量的游戏内物品和世界物品库,为实现更多样化的游戏体验铺平道路。著名的 AAA 级开发商动视暴雪建立了暴雪扩散(Blizzard Diffusion)系统,这是图像生成器 Stable Diffusion 的翻版,可帮助生成各种角色和服装的概念图。
游戏中的文字和对话也可以进行个性化处理。世界中的标志可以反映玩家获得的某种头衔或地位。可以将 NPC 设置为具有独特个性的 LLM 智能体,并根据玩家的行为进行调整。例如,对话可以根据玩家过去与智能体的行为进行更改。我们已经在一款 AAA 级游戏中看到了这一概念的成功实施,Monolith 的《魔多之影》中就有一个复仇系统,它可以根据玩家的行为为反派动态地创建有趣的背景故事。这些个性化元素使每次游戏体验都独一无二。
游戏发行商育碧(Ubisoft)最近披露了由 LLMs 支持的对话工具 Ghostwriter。如今,发行商使用该工具可以自动生成对话,帮助模拟玩家周围的生活世界。
从玩家的角度来看,AI 增加了游戏的沉浸感和可玩性。在《天际》和《侠盗猎车手 5》等沉浸式开放世界游戏中,角色扮演类 mod 经久不衰,这表明了玩家对个性化故事的潜在需求。即使在今天,《侠盗猎车手 5》中角色扮演服务器的玩家数量也一直高于原版游戏。我们认为,在未来,个性化系统将成为所有游戏中吸引和留住玩家的不可或缺的实时运营工具。
当然,一款好的游戏不仅仅只有角色和对话。另一个有意思的场景是利用生成式 AI 来讲述更好、更个性化的故事。
《Dungeons & Dragons》是游戏中个性化叙事的鼻祖,在这款游戏中,一个被称为「地下城主」的人准备向一群朋友讲述一个故事,这些朋友各自扮演故事中的角色。由此产生的故事既是即兴戏剧,又是 RPG 游戏,这意味着每次游戏都是独一无二的。作为个性化故事讲述需求的一个信号,今天的 《Dungeons & Dragons》比以往任何时候都更受欢迎,数字和模拟产品的销售量屡创新高。
如今,许多公司正在将 LLM 应用于《Dungeons & Dragons》故事模式。其中的机遇在于,玩家可以在无限耐心的 AI 故事讲述者的引导下,在自己喜爱的玩家创作或 IP 宇宙中尽情挥洒时间。Latitude 的 AI Dungeon 于 2019 年推出,是一款开放式、基于文本的冒险游戏,其中 AI 扮演地下城主。用户还对 OpenAI 的 GPT-4 版本进行了微调,以便玩《Dungeons & Dragons》,并取得了可喜的成果。Character.AI 的文字冒险游戏是该应用最受欢迎的模式之一。
Hidden Door 则更进一步,根据特定的源材料集(例如《绿野仙踪》)训练机器学习模型,让玩家在既定的 IP 宇宙中进行冒险。通过这种方式,Hidden Door 与知识产权所有者合作,实现了一种新的、互动形式的品牌延伸。只要粉丝们看完一部电影或一本书,他们就可以通过类似于《Dungeons & Dragons》的定制活动,在自己喜爱的世界里继续冒险。粉丝体验的需求正在蓬勃发展,仅在 5 月份,Archiveofourown.org 和 Wattpad 这两个最大的在线粉丝小说库的网站访问量就分别超过了 3.54 亿次和 1.46 亿次。
NovelAI 开发了自己的 LLM Clio,利用它在沙盒模式下讲述故事,帮助人类作家解决写作障碍难题。对于最挑剔的作家来说,NovelAI 可以让用户根据自己的作品,甚至是 H.P. Lovecraft 或 Jules Verne 等著名作家的作品对 Clio 进行微调。
值得注意的是,在 AI 故事制作完全就绪之前还有许多障碍。如今,要打造一个优秀的 AI 讲故事者,需要大量的人为规则设定,以创造出定义好故事的叙事线。记忆和连贯性非常重要,讲故事的人需要记住故事前面发生了什么,并在事实和风格上保持一致。可解释性对于许多以黑盒形式运行的封闭源代码来说仍然是一个挑战,而游戏设计师则需要了解系统的行为方式,以改善游戏体验。
然而,在克服这些障碍的同时,AI 已经成为人类讲故事者的「副驾驶」。如今,数百万作家使用 ChatGPT 为自己的故事提供灵感。娱乐工作室 Scriptic 将 DALL-E、ChatGPT、Midjourney、Eleven Labs 和 Runway 与人类编辑团队融合在一起,制作了互动式自选冒险节目,目前已在 Netflix 上播出。
虽然基于文本的故事很受欢迎,但许多玩家也渴望看到自己的故事以可视的方式栩栩如生地呈现出来。生成式 AI 在游戏中的最大机遇之一,或许是帮助创建玩家花费无数时间沉浸其中的生活世界。
最终的愿景是能够随着玩家在游戏中的进展实时生成关卡和内容。科幻小说《安德的游戏》(Ender's Game)中的「心灵游戏」(Mind Game)就是这种游戏的典型例子。心灵游戏是一款由 AI 指导的游戏,能根据每个学生的兴趣进行实时调整,游戏世界会根据学生的行为和 AI 推断出的任何其他心理信息而不断变化。
如今,与「智力游戏」最接近的可能是 Valve 的《Left 4 Dead》系列游戏,该游戏利用 AI 指导动态调整游戏节奏和难度。AI 总监并没有设定敌人(僵尸)的生成点,而是根据每个玩家的状态、技能和位置,将僵尸放置在不同的位置,从而在每次游戏中创造出独特的体验,总监还通过动态视觉效果和音乐来营造游戏氛围。Valve 创始人加布 - 纽维尔(Gabe Newell)将这一系统称为「程序化叙事」。EA 广受好评的《死亡空间》重制版使用了 AI 导演系统的变体,将恐怖效果发挥到极致。
虽然这在今天看来可能只是科幻小说中的情节,但有朝一日,随着生成模型的改进以及足够多的计算和数据的获取,我们有可能制造出一个不仅能制造惊吓,还能制造世界本身的 AI 导演。
值得注意的是,游戏中机器生成关卡的概念并不新鲜。从 Supergiant 的《哈迪斯》(Hades)到暴雪的《暗黑破坏神》(Diablo),再到 Mojang 的《我的世界》(Minecraft),许多当今最流行的游戏都使用了程序生成技术,即使用由人类设计师运行的方程式和规则集随机创建关卡,每次闯关都不相同。目前已经建立了一整套软件库来协助程序生成。Unity 的 SpeedTree 可帮助开发人员生成虚拟树叶,您可能在《阿凡达》中潘多拉星球的森林或《Elden Ring》的景观中见过。
一款游戏可以将程序资产生成器与用户界面中的 LLM 结合起来。游戏《Townscaper》使用程序系统,只需玩家输入两个信息(方块的位置和颜色),就能将其快速转化为绚丽的城镇景观。想象一下,在用户界面中加入 LLM 的 Townscaper,通过自然语言提示,帮助玩家迭代出更加精细和精美的作品。
许多开发者还对利用机器学习增强程序生成的潜力感到兴奋。有朝一日,设计师可以利用在风格相似的现有关卡上训练出来的模型,反复生成可行的关卡初稿。今年早些时候,Shyam Sudhakaran 带领哥本哈根大学的一个团队创建了 MarioGPT——一种 GPT2 工具,它可以使用根据《超级马里奥 1》和《超级马里奥 2》的原始关卡训练出来的模型生成超级马里奥关卡。这一领域的学术研究已经有一段时间了,包括 2018 年利用生成对抗网络(GAN)设计第一人称射击游戏《毁灭战士》(DOOM)关卡的项目。
生成模型与程序系统配合使用,可以大大加快资产创建的速度。艺术家们已经开始将文本到图像的扩散模型用于 AI 辅助的概念艺术和故事板制作。大型机视觉特效主管 Jussi Kemppainen 在这篇博客中描述了他如何在 Midjourney 和 Adobe Firefly 的帮助下为一款 2.5D 冒险游戏构建世界和角色。
3D 生成技术也得到了大量研究。Luma 利用神经辐射场(NeRFs),让消费者可以通过 iPhone 上捕捉的 2D 图像构建逼真的 3D 资产。Kaedim 采用 AI 和人工质量控制相结合的方法来创建可立即投入生产的 3D 网格,目前已有超过 225 家游戏开发商在使用。CSM 最近发布了一个专有模型,可以从视频和图像中生成 3D 模型。
从长远来看,使用 AI 模型进行实时世界构建才是最重要的。在我们看来,未来整个游戏不再需要渲染,而是利用神经网络在运行时生成。英伟达的 DLSS 技术已经可以使用消费级 GPU 即时生成新的高分辨率游戏帧。也许有一天,你可以点击 Netflix 电影中的「互动」按钮,然后步入每个场景都是即时生成并为玩家量身定制的世界。在未来,游戏将与电影无异。
值得注意的是,动态生成的世界本身并不足以制作出一款优秀的游戏,《无主之地》(No Man's Sky)的评论就证明了这一点。动态世界的前景在于它与其他游戏系统(个性化、生成智能体等)的结合,从而开启新颖的故事讲述形式。毕竟,「心灵游戏」最引人注目的部分是它如何为埃德塑造自己,而不是世界本身。
虽然我们之前介绍过生成式智能体在模拟游戏中的应用,但还有另一种新兴的用例,即 AI 充当游戏副驾驶,指导我们玩游戏,在某些情况下甚至与我们并肩作战。
对于复杂游戏的玩家入门来说,AI 副驾驶的作用不可估量。例如,像 Minecraft、Roblox 或 Rec Room 这样的 UGC 沙盒游戏就是一个丰富的环境,玩家只要有合适的材料和技能,几乎可以建造任何他们能想象到的东西。但学习门槛很高,大多数玩家都不容易找到入门方法。
AI 副驾驶可以让任何玩家成为 UGC 游戏中的建造大师,根据文字提示或图片提供逐步指导,并指导玩家克服错误。乐高世界中的「建筑大师」概念就是一个很好的参照物,这些稀有的人拥有天赋,能够在需要时看到他们所能想象的任何创造物的蓝图。
微软已经开始为《我的世界》开发 AI 辅助系统,该系统使用 DALL-E 和 Github Copilot,让玩家能够通过自然语言提示为《我的世界》会话注入资产和逻辑。Roblox 正在积极地将人工智能生成工具整合到 Roblox 平台中,其使命是让「每个用户都能成为创造者」。从使用 Github Copilot 进行编码到使用 ChatGPT 进行写作, AI 副驾驶在共同创造方面的有效性已经在许多领域得到了验证。
除了共同创作之外,根据人类游戏数据训练的 LLM 应该能够理解在各种游戏中的行为方式。通过适当的整合,智能体可以在玩家的朋友无法参与时充当合作伙伴,或者在《FIFA》和《NBA 2k》等正面交锋游戏中担任另一方。这样的智能体可以随时参与游戏,无论胜利还是失败,都和蔼可亲,不会去指责玩家。根据我们的个人游戏历史进行微调,这样的智能体可以大大优于现有的机器人,完全按照我们自己的方式进行游戏,或者以互补的方式进行游戏。
类似的项目已经在受限环境下成功运行。流行的赛车游戏《Forza》开发了一个「Drivatar」系统,利用机器学习为每个人类玩家建立一个 AI 驾驶员,模仿他们的驾驶行为。Drivatars 被上传到云端,当人类伙伴离线时,可以调用 Drivatars 与其他玩家进行比赛,甚至还能获得胜利积分。谷歌 DeepMind 的 AlphaStar 以「长达 200 年」的《星际争霸 II》游戏数据集为基础进行训练,创造出可以与人类电竞高手对战并击败他们的智能体。
AI 副驾驶作为一种游戏机制,甚至可以创造出全新的游戏模式。想象一下《堡垒之夜》,但每个玩家都有一根「建筑大师」魔杖,可以通过提示立即建造狙击塔或火焰巨石。在这种游戏模式中,胜负可能更多取决于魔杖的作用(提示),而不是瞄准枪支的能力。
游戏中完美的 AI「伙伴」一直是许多流行游戏系列中令人难忘的一部分。例如《光环》宇宙中的 Cortana、《最后生还者》中的 Elle 或《生化奇兵:无限》中的 Elizabeth。对于竞技游戏来说,殴打电脑机器人永远不会过时——从《太空入侵者》中的油炸外星人到《星际争霸》中的对战跺脚,最终都演变成了自己的游戏模式「合作指挥官」。
随着游戏发展成为下一代社交网络,我们预计 AI 副驾驶将扮演越来越重要的社交角色。增加社交功能可以提高游戏的粘性,这一点已经得到了充分证实,有朋友陪伴的玩家的留存率最高可提高 5 倍。在我们看来,未来每款游戏都会有一名 AI 副驾驶。
在将 AI 应用于游戏方面,我们还处于起步阶段,许多法律、道德和技术方面的障碍都需要解决,然后才能将这些想法付诸实践。目前,除非开发者能证明用于训练模型的所有数据的所有权,否则使用人工智能生成资产的游戏的法律所有权和版权保护在很大程度上还不明确。这使得现有特许知识产权的所有者很难在其生产流水线中使用第三方 AI 模型。
如何补偿训练数据背后的原作者、艺术家和创作者也是一个重大问题。目前面临的挑战是,大多数 AI 模型都是在互联网的公共数据上训练出来的,其中大部分都是受版权保护的作品。在某些情况下,用户甚至能够利用生成模型重现艺术家的风格。现在还为时尚早,内容创作者的补偿问题还需要妥善解决。
目前大多数生成模型的成本太高,无法在云中以 24/7 的全球规模运行,这是现代游戏运营所需要的。为了降低成本,应用程序开发人员可能需要找到将模型工作负载转移到最终用户设备的方法,但这需要时间。
然而,目前显而易见的是,游戏开发者和玩家对游戏生成式 AI 有着极大的兴趣。虽然也有很多炒作,但我们看到这个领域有很多有才华的团队在加班加点地打造创新产品,这让我们感到非常兴奋。
机会不仅仅在于让现有游戏变得更快、更便宜,还在于开创出一种全新的 AI 游戏,而这在以前是不可能实现的。我们尚不清楚这些游戏将以何种形式出现,但我们知道游戏产业的历史一直是技术推动新玩法形式的历史之一。有了生成式智能体、个性化、AI 叙事、动态世界构建和 AI 副驾驶等系统,我们可能即将看到由 AI 开发者创造的第一款「永无止境」的游戏。
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。