微软有 介绍 一种名为 Magnetic-One 的新型多代理人工智能 (AI) 系统,旨在使用多个专门代理完成复杂的任务。该系统作为 Microsoft AutoGen 上的开源工具提供,旨在帮助开发人员和研究人员创建可以跨各个领域自主管理多步骤任务的应用程序。
什么是磁力一号?
Magnetic-One 是一种通用的多智能体系统,它使用协调器来协调不同的智能体,每个智能体专门从事特定的任务。首席代理称为 Orchestrator,与四名专业代理一起工作:
- 网上冲浪代理:处理网页浏览、点击和网页内容摘要。
- 文件浏览器代理:管理本地文件、目录和文件夹。
- 编码员代理:编写和执行代码、分析信息以及创建新项目。
- 电脑终端代理:为Coder Agent提供程序执行的控制台。
这些代理协同工作来解决开放式任务,使 Magnetic-One 适用于软件工程、数据分析和科学研究等应用。微软将 Magnetic-One 描述为“单代理系统的灵活且可扩展的替代方案”,因为它采用模块化设计,允许在不影响系统核心结构的情况下添加或删除代理。

主要特点
Magnetic-One 之所以脱颖而出,是因为它能够使用单一语言模型激活多个代理。该系统可以执行各种任务,从浏览 Web 浏览器到执行 Python 代码。此功能意味着它可以处理现实场景,例如订票、购买产品或在本地设备上编辑文档。
模块化多代理架构确保每个代理都有不同的职责,从而提高复杂、多步骤任务的效率。这种方法使 Magnetic-One 能够将问题划分为子任务,从而提高任务完成的准确性和速度。例如,如果系统被要求预订电影票,每个代理将处理任务的不同部分,例如处理视觉信息、浏览网站和完成交易。
微软的 AutoGen 框架为 Magnetic-One 提供支持,支持与各种大大小小的语言模型集成,以满足不同的成本和性能要求。目前,该系统已经使用 GPT-4o 和 OpenAI 的 o1-preview 等模型进行了测试,尽管它仍然与模型无关,从而为未来提供了灵活性。
为了评估 Magnetic-One 的有效性,微软还发布了 AutoGenBench,这是一种在 GAIA、AssistantBench 和 WebArena 等多个基准上评估代理性能的工具。这些基准测试重点关注多步骤规划和工具使用等任务。 Microsoft 从 2024 年 10 月开始的初步测试表明,Magnetic-One 提供的结果与最先进的方法相比具有竞争力。
视频:微软
增长趋势:多代理系统
Magnetic-One 是多智能体人工智能系统不断增长的趋势的一部分。 OpenAI 推出 Swarm,另一个旨在构建和部署多代理系统的框架。同样,IBM 推出了 蜜蜂代理框架,一个开源工具包,支持部署基于代理的工作流程,与诸如 IBM花岗岩 和 骆驼3.2。这些系统与 Magnetic-One 非常相似,旨在为复杂的问题解决任务提供可扩展的解决方案。
据微软介绍,“Magnetic-One 的即插即用设计支持轻松适应和可扩展性,无需更改其他代理或整体架构即可添加或删除代理。”这种灵活性对于不断变化的业务需求和新应用程序尤其重要,使 Magnetic-One 成为寻求创建更具适应性的人工智能系统的研究人员和开发人员的有前途的工具。
特色图片来源: 凯雷姆·葛兰/表意文字