序
从 Lilian Weng 的《LLM Powered Autonomous Agents》让我们初步了解,基于大型语言模型的 AI-Agents systems 是一个什么样的架构形式,从单一智能体的 Planning \Tools\Memory\Action 四大构成部分,让我们初步理解了智能体作为一种迈向为了通用人工智能应用的一种可能形态,我们似乎可以借助智能体处理我们日常工作中的一切问题;
在谷歌与斯坦福的研究员联合发表的《Generative Agents: Interactive Simulacra of Human Behavior》的论文中,我们看到的以大型语言模型驱动的,多智能体在沙盒环境中的可能发展形态,25 个小镇居民 NPC 的背后是由 25 个智能体驱动,在沙盒环境中,围绕日常生活展开一系列的交互行为,无论是工作还是生活,智能体都在小镇沙盒中展开了完全自主驱动的自动化行为。事实上,学术领域展开了进一步的探讨,我们将能够摘取智能体在沙盒环境中的劳动结果。
事实上,随着 AGI 技术愿景的驱动,大型语言模型将进一步重构整个互联网成为智能网络时,智能体将成为人类与智能网络,建立交互协作的一个关键,具有自主性的智能体将遍布整个智能网络,多智能体协作网络,将会成为改变我们未来社会生产关系的核心力量。
正如超级个体与一人公司的叙事崛起,正是由于人类掌握了智能体团队,参与到智能体协作网络中,实现更高效的生产效益。如果我们要提前未来的社会形态如何,未来的商业规律如何,我们必须深刻理解,什么是多智能体,多智能体如何更好地帮助人类实现自动化工作,如何帮助整个社会如何做出更好地发展决策?
未来已来,一个遍布智能体的数字社会正在浮现。本次推荐的十篇论文,将有助于你理解多智能体对我们未来的影响,以及将通过何种方式陆续呈现。
Part.1
MetaGPT: 多智能体协同框架的元编程
论文标题:MetaGPT: Meta Programming for Multi-Agent Collaborative Framework
论文地址:https://arxiv.org/pdf/2308.00352.pdf
最近,通过使用大型语言模型(LLMs)驱动的多智能体,自动任务解决取得了显著进展。然而,现有基于 LLM 的多智能体工作主要集中在解决简单的对话任务上,很少研究复杂任务,主要是由于 LLM 幻觉问题。这种幻觉问题在天真地链接多个智能代理时会成倍增加,导致无法有效解决复杂问题。因此,我们引入了 MetaGPT,这是一个创新性的框架,将高效的人类工作流程作为元编程方法融入基于 LLM 的多智能体协作中。
具体而言,MetaGPT 将标准化操作流程(SOPs)编码为提示,以增强结构化协调。随后,它要求模块化输出,赋予代理人与人类专业人员相媲美的领域专业知识,以验证输出并最小化累积错误。通过这种方式,MetaGPT 利用了装配线范式,为各种智能体分配不同的角色,从而建立了一个可以有效且协调地解构复杂多智能体协作问题的框架。
我们在协作软件工程基准测试上的实验表明,与现有的基于聊天的多智能体系统相比,MetaGPT 生成了更连贯和正确的解决方案。这凸显了将人类领域知识整合到多智能体系统中的潜力,从而为解决复杂的现实世界挑战创造了新机会。
本项目的 GitHub 存储库可在以下链接上公开访问:https://github.com/geekan/MetaGPT。
Part.2
GPT 循环:多智能体系统的自适应决策
论文标题:GPT-in-the-Loop: Adaptive Decision-Making for Multiagent Systems
论文地址:https://arxiv.org/pdf/2308.10435.pdf
本论文介绍了一种新颖的方法,称为“GPT-in-the-loop”方法,它将大型语言模型(LLMs)如 Generative Pretrained Transformers (GPT) 的高级推理能力与多智能体(MAS)系统相结合。与通常需要长时间培训过程的传统自适应方法不同,我们的框架采用了 GPT-4 以提高问题解决和解释能力。
我们的实验背景是智能路灯物联网(IoT)应用。在这里,代理使用传感器、执行器和神经网络创建节能照明系统。通过集成 GPT-4,这些代理实现了卓越的决策能力和适应性,无需进行大量培训。我们将这种方法与传统的神经进化方法以及软件工程师提供的解决方案进行了比较,突显了 GPT 驱动的多智能体系统在 IoT 中的潜力。
在结构上,本文概述了将 GPT 整合到物联网(IoT)驱动框架(FIoT)中,介绍了我们提出的 GPT-in-the-loop 方法,在 IoT 上下文中呈现了比较结果,并以见解和未来方向作出了总结。
关键词:GPT-in-the-loop,LLM-in-the-loop,多智能体系统(MAS),自适应,Generative pre-trained transformer(GPT)。
Part.3
使用大语言模型模块化地构建合作体验智能体
论文标题:Building Cooperative Embodied Agents Modularly with Large Language Models
论文地址:https://briefgpt.xyz/a/2307.02485
大型语言模型(LLMs)已经在各个领域的单一智能体具体任务中展示出令人印象深刻的规划能力。然而,它们在多智能体合作中的规划和沟通能力仍然不清楚,尽管这些是智能具体智能体关键的技能。
在本文中,我们提出了一个新颖的框架,利用 LLMs 进行多智能体合作,并在不同的具体环境中进行测试。我们的框架使具体智能体能够有效地规划、沟通和与其他具体智能体或人类合作,以完成长期任务。我们证明了最近的 LLMs,如 GPT-4,可以在不需要精细调整或少量提示的情况下超越强大的基于规划的方法,并使用我们的框架展示出新兴的有效沟通能力。
我们还发现,使用自然语言进行沟通的 LLM 基础的代理可以赢得更多的信任并更有效地与人类合作。我们的研究强调了 LLMs 在具体智能体领域的潜力,并为未来的多智能体合作研究奠定了基础。
有关视频可以在项目网站 https://vis-www.cs.umass.edu/Co-LLM-Agents/ 上找到。
Part.4
基于自适应大型语言模型(LLM)的多智能体系统
论文标题:Self-Adaptive Large Language Model (LLM)-Based Multiagent Systems
论文地址:https://briefgpt.xyz/a/2307.06187
在自主计算中,自适应已被提出作为管理多智能体系统(MASs)复杂性的基本范 paradigm。通过扩展一个系统以支持监控和自适应自身以实现特定的关注点,这一目标得以实现。
在涉及代理互动的场景中,这些系统中的通信至关重要,因为它通过实现直接、清晰的信息交流,增强了合作并减少了协调挑战。然而,改进与 MASs 的交互通信的表达能力并非没有挑战。在这方面,自适应系统与有效沟通之间的相互作用对于未来 MAS 的进展至关重要。在本文中,我们提出将大型语言模型(LLMs)如基于 GPT 的技术集成到多智能体系统中。
我们将我们的方法基于 MAPE-K 模型,该模型以其在监控、分析、规划和执行系统自适应以响应动态环境方面的强大支持而闻名。我们还提供了所提出方法的实际示例,其中我们实施和评估了一个基于 MAS 的基本应用程序。该方法通过提出一种基于 LLM 能力的自主系统的 MAS 自适应的新范 paradigm,显著推进了自适应系统的最新技术水平。
关键词—自适应、软件开发、多智能体系统、MAPE-K、大型语言模型、通用技术。
Part.5
AgentVerse:促进多智能体协作并探索智能体的 emergent behaviors
论文标题:AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors in Agents
论文地址:https://arxiv.org/pdf/2308.10848.pdf
论文概述:由大型语言模型(LLMs)赋能的自主代理经历了显著的改进,使它们能够在广泛的任务范围内进行泛化。然而,在现实世界的情景中,个体之间的合作通常是为了增强任务完成的效率和效果而必要的。
因此,受到人类群体动态的启发,我们提出了一个多智能体框架 AGENTVERSE,它可以协同并动态地调整其构成,形成一个大于部分之和的系统。我们的实验表明,AGENTVERSE 框架可以有效地部署多智能体群体,胜过单一代理。此外,我们深入探讨了在协作任务完成过程中个体代理之间的社会行为的出现。
鉴于这些行为,我们讨论了一些可能的策略,以利用积极的行为并减轻消极行为,以提高多智能体群体的协作潜力。我们的 AGENTVERSE 代码将很快发布在 https://github.com/OpenBMB/AgentVerse。
Part.6
ChatEval:基于多智能体辩论的 LLM 评估器改进
论文标题:ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate
论文地址:https://arxiv.org/pdf/2308.07201.pdf
文本评估在历史上一直面临着重大挑战,通常需要大量的人力和时间成本。随着大型语言模型(LLMs)的出现,研究人员开始探索 LLMs 作为人工评估替代方法的潜力。虽然这些基于单一代理的方法显示出前景,但实验结果表明需要进一步的改进来弥合它们当前的有效性与人工评估质量之间的差距。
鉴于人工评估过程的最佳实践通常涉及多个人工标注者协作进行评估,我们采用了一种多智能体辩论框架,超越了单一代理的提示策略。多智能体的方法使一组 LLMs 能够与各种智能对手协同合作,利用他们独特的能力和专业知识,提高处理复杂任务的效率和效果。
在本文中,我们构建了一个名为 ChatEval 的多智能体裁判团队,用于自主讨论和评估不同模型在开放式问题和传统自然语言生成(NLG)任务中生成的响应的质量。我们从人类发起团队讨论进行头脑风暴的实际情景中提取见解和经验,并在 ChatEval 中提出不同的沟通策略。我们在两个基准任务上的实验表明,ChatEval 在准确性和与人工评估一致性方面表现出卓越的性能。
此外,我们发现在多智能体辩论过程中,不同角色的提示(不同的人物角色)是必不可少的;也就是说,在提示中使用相同的角色描述可能导致性能下降。我们的定性分析还显示,ChatEval 超越了纯文本评分,提供了可靠评估的模仿人类评估过程。
我们的代码可在https://github.com/chanchimin/ChatEval 上获得。
Part.7
一种多智能体框架,用于异步和协作扩展多任务机器学习系统
论文标题:A Multiagent Framework for the Asynchronous and Collaborative Extension of Multitask ML Systems
论文地址:https://arxiv.org/pdf/2209.14745.pdf
论文概述:传统的机器学习开发方法不允许大量不同目标的贡献者集体共同创建和扩展共享智能系统。启用这种协作方法可以加速创新速度,增加机器学习技术的可访问性,并促使新的能力出现。
我们认为,通过模块化表示机器学习模型和定义新的抽象,允许实现和执行各种方法来异步使用和扩展模块化智能系统,可以展示这种新颖的机器学习开发方法。我们提出了一个多智能体框架,用于协同和异步扩展动态的大规模多任务系统。
Part.8
通过多智能体辩论提高语言模型的事实性和推理能力
论文标题:Improving Factuality and Reasoning in Language Models through Multiagent Debate
论文地址:https://arxiv.org/pdf/2305.14325.pdf
论文概述:近年来,大型语言模型(LLMs)在语言生成、理解和少样本学习方面展示出了显著的能力。大量研究工作已经探讨了如何通过提示工具进一步提高它们的性能,包括验证、自我一致性或中间草稿。
ji'ogu 在本文中,我们提出了一种补充性的方法,以改善语言响应,其中多个语言模型实例提出并讨论它们的个体响应和推理过程,经过多轮辩论最终得出共同的最终答案。我们的研究结果表明,这种方法显著提高了在多个任务中的数学和战略推理能力。我们还证明了我们的方法提高了生成内容的事实准确性,减少了当代模型容易产生的错误答案和幻觉。我们的方法可以直接应用于现有的黑盒模型,并对我们调查的所有任务使用相同的过程和提示。
总的来说,我们的研究结果表明,这种“思维之社”方法有潜力显著提升 LLMs 的能力,并为语言生成和理解领域的进一步突破铺平了道路。项目网站位于 https://composable-models.github.io/llm_debate/。
Part.9
团队体育分析中的多智能体挑战
论文标题:Presenting Multiagent Challenges in Team Sports Analytics
论文地址:https://arxiv.org/pdf/2303.13660.pdf
本文探讨了团队体育分析领域的若干挑战和机遇与多智能体系统(MAS)关键研究领域之间的相关性。我们具体考虑了入侵类比赛,这些比赛被定义为球员侵入对方团队领地并可以在比赛场地上的任何地方进行互动的比赛,如冰球、足球和篮球。
我们认为 MAS 非常适合研究入侵类比赛,并将使 MAS 和体育分析领域都受益。我们的讨论突出了在两个方向上进行 MAS 实施和进一步发展的领域:短期比赛策略(教练)和长期团队规划(管理)。
Part.10
网络代理的去中心化多智能体强化学习:最新进展
论文标题:Decentralized Multi-Agent Reinforcement Learning with Networked Agents: Recent Advances
论文地址:https://arxiv.org/pdf/1912.03821.pdf
论文概述:多智能体强化学习(MARL)长期以来一直是机器学习和控制领域的一个重要且持久的研究课题。随着最近单一智能体深度强化学习的发展,人们对开发新的 MARL 算法产生了兴趣复苏,尤其是那些经过理论分析支持的算法。
在本文中,我们回顾了这个主题的一个子领域的一些最新进展:具有网络化智能体的分散 MARL。具体而言,多个智能体在共同的环境中进行顺序决策,而没有任何中央控制器的协调。相反,允许智能体在通信网络上与它们的邻居交换信息。这种设置在机器人、无人车辆、移动传感器网络和智能电网的控制和运营中有广泛的应用。
这个回顾基于我们在这个方向上的一些研究努力,以及其他研究人员在这个领域取得的一些进展。我们希望这个回顾能激发更多的研究力量投入到这个充满挑战但令人兴奋的领域。
关键词:强化学习;多智能体 / 网络系统;共识 / 分布式优化;博弈论。
end
📢 AI-Agents 前沿观察站
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。