AMD 的下一代 AI 机架级系统 Helios MI455X 近日首次揭开面纱。据 Tom's Hardware 报道,该平台被定位为英伟达 NVL72 VR200 的直接竞品,计划在 2025 年下半年推向市场。Helios 将搭载 AMD 最新的 MI455X 加速器,并采用机架级设计以支持大规模 AI 训练与推理任务。

值得关注的是其互联方案。AMD 原本是 UALink(Ultra Accelerator Link)开放互联标准的主要推动者之一,该标准旨在为 AI 加速器提供高带宽、低延迟的芯片间通信。然而,Helios 的初期出货版本并不会配备真正的 UALink 物理层,而是通过以太网来承载 UALink 协议。这意味着系统在逻辑上使用 UALink 通信,但实际数据跑在标准以太网硬件上。Tom's Hardware 分析认为,这种过渡性设计可能在需要极高通信带宽和超低延迟的 workloads(如千亿参数大模型的张量并行训练)中暴露出性能短板,因为以太网的原生开销和拥塞控制机制会引入额外延迟。

从产业背景看,AMD 此举反映出 AI 基础设施领域竞争的急剧升温。英伟达凭借 NVLink 和 NVSwitch 构建了封闭但性能强悍的机架级系统生态,从 Grace Hopper 到 Vera Rubin 平台,持续拉高算力密度与互联带宽的标杆。AMD 则试图通过 UALink 联盟(成员包括博通、英特尔、微软、Meta 等)打造开放标准,以降低客户对英伟达专有互联的依赖。但开放标准的落地往往慢于预期,Helios 先用以太网“过渡”的策略,既是抢占上市时间的务实之举,也暴露出 UALink 物理层就绪度不足的现实。

对 AI 产业投资者而言,Helios 的亮相传递了多重信号。在芯片层,AMD 正加速从单卡竞争转向系统级对抗,其 MI455X 若能配合成熟的互联方案,有望在云厂商自研芯片和英伟达之外切出一块市场。在基础设施层,互联技术正成为算力集群性能的“胜负手”——无论是以太网、InfiniBand 还是 UALink,谁能在带宽、延迟和生态采纳度之间取得平衡,谁就能影响下一代数据中心的设计方向。不过,初期以太网方案的性能折损可能让部分潜在客户持观望态度,尤其是在训练超大模型时,互联瓶颈会直接拖累 GPU 利用率。市场将密切关注 Helios 的实际基准测试结果,以及真正原生 UALink 系统的落地时间表。