英伟达联合创始人兼首席执行官黄仁勋在华盛顿 GPU 技术大会上推出了 Vera Rubin AI 超级芯片,标志着该公司在 AI 热潮中转向 AI 硬件,使其市值升至近 5 万亿美元。 Vera Rubin 平台面向高强度生成式 AI 工作负载。它集成了一个 Vera CPU,配备 88 个定制 ARM 内核,支持 176 个线程。该 CPU 与两个 Rubin GPU 配对,可实现高达 100 petaFLOPS 的 FP4 计算性能。作为 Nvidia 的第三代 NVLink 72 机架级计算机,Vera Rubin 继承了 GB200 和 GB300 型号。该系统采用液体冷却并包含 6 万亿个晶体管。它还包括 2 TB 低延迟 SOCAMM2 内存,可有效处理要求苛刻的 AI 处理任务。在其基本配置中,Vera Rubin 提供的原始计算性能大约是基于 Volta 的 DGX-1 的 100 倍。早期的平台是 Nvidia 最初的深度学习系统,可提供 170 teraflops 的 FP16 峰值性能。这一大幅增长凸显了多年来人工智能应用计算能力的演变。 Nvidia 计划发布各种配置的 Vera Rubin 以满足不同的需求。 NVL144 设置包括两个标线大小的 GPU,可实现高达 3.6 exaflops 的 FP4 推理性能和 1.2 exaflops 的 FP8 训练性能。为了增强功能,NVL144 CPX 配置达到 8 exaflops,相当于当前一代 GB300 NVL72 系统功率的 7.5 倍。为了满足超大规模数据中心处理更大模型上下文工作负载的要求,Nvidia 推出了 Rubin Ultra NVL576 系统。该变体使用四个十字线大小的 GPU 以及高达 365 TB 的高速内存。它可提供高达 15 exaflops 的 FP4 推理性能和 5 exaflops 的 FP8 训练性能,相当于 GB300 的 8 倍。每个 Rubin GPU 由两个计算芯片和八个 HBM4 内存堆栈组成,可优化数据吞吐量和计算。 GPU 板具有五个 NVLink 背板连接器。顶部的两个连接器将 GPU 连接到 NVLink 交换机以实现高速互连。三个底部连接器管理供电、PCIe 接口和 CXL 连接,以支持更广泛系统中的集成。黄仁勋预计 Rubin GPU 将在 2026 年下半年进入量产。NVL144 系统计划于 2026 年晚些时候或 2027 年初推出。同时,NVL576 系统预计将在 2027 年下半年上市,这与 Nvidia 推进人工智能基础设施的路线图保持一致。 https://www.youtube.com/watch?v=lQHK61IDFH4





