微软 宣布 周一发布的 Maia 200 芯片用于扩展 AI 推理,具有超过 1000 亿个晶体管,比 2023 年的 Maia 100 具有更快的速度和更高的效率。Maia 200 在 4 位精度下提供超过 10 petaflops,在 8 位性能下提供约 5 petaflops。微软称其为专为人工智能推理任务而设计的硅主力。此过程涉及运行训练有素的人工智能模型来生成输出,这与构建这些模型的训练阶段不同。随着人工智能业务的扩展,推理现在在总计算支出中所占的份额越来越大,从而推动了简化推理的努力。该公司将 Maia 200 定位为减少人工智能部署中的运营中断和功耗。配备该芯片的单个节点可以处理当前最大的人工智能模型,同时为未来更大的模型留出容量。微软表示,“实际上,一个 Maia 200 节点可以轻松运行当今最大的模型,并为未来更大的模型提供足够的空间。”此版本符合主要科技公司开发定制处理器的模式,以减少对 Nvidia 图形处理单元的依赖,而图形处理单元在人工智能工作负载中占主导地位。 Nvidia GPU 已成为人工智能成功的核心,催生了管理硬件支出的替代方案。谷歌提供的张量处理单元(TPU)不是作为独立芯片,而是作为基于云的计算资源。亚马逊提供Trainium AI加速器芯片,并于12月发布了第三代Trainium 3。这些选项允许公司将一些工作负载从 Nvidia 硬件上转移出来,从而降低总体成本。微软声称 Maia 200 在关键指标上优于竞争对手。它的 FP4 性能是亚马逊第三代 Trainium 芯片的三倍。正如该公司周一的新闻稿中详细介绍的那样,其 FP8 性能超过了谷歌第七代 TPU。该芯片已经支持内部人工智能工作。它为微软超级智能团队开发的模型提供支持。 Copilot 聊天机器人的操作也依赖于 Maia 200 硬件。从周一开始,微软向外部用户发出了邀请。开发人员、学者和前沿人工智能实验室现在可以访问 Maia 200 软件开发套件以集成到他们的工作负载中。





