英伟达正式宣布其 Spectrum-X 以太网硅光技术已开启全面量产,新一代交换机基于光电一体封装(CPO)架构,直接将硅光引擎与交换芯片共封装在同一基板上,跳过传统可插拔光收发器环节。该方案专为下一代 Vera Rubin 计算平台设计,目标场景是横向扩展至数十万 GPU 节点、乃至跨区域部署的 AI 工厂,试图解决超大规模集群中长期困扰运营团队的功耗与互联可靠性问题。

根据官方披露的数据,与传统使用分立收发器的网络相比,新平台在能效端实现了 **5 倍** 的改善,AI 集群的正常运行时间提高 **5 倍**,部署时间则缩短为原来的 **1.3 倍**。这些指标直接对应着万卡级训练集群的运营稳定性与总体拥有成本。Spectrum-X 并非单纯的交换芯片迭代,而是英伟达网络部门拉通计算、网络、光器件、连接器和系统设计的全栈协同成果,此次量产意味着 CPO 方案从概念验证真正进入商业数据中心的大规模部署通道。

这一技术路线切换的背景是,AI 训练集群规模正从数千卡向十万卡乃至百万卡跃进,传统可插拔光模块的功耗密度和故障率已成显性瓶颈。业界此前已在 800G、1.6T 光模块上尝试 LPO(线性直驱)等方案降功耗,但英伟达选择直接跳过中间路线,以 CPO 将光学连接逼近交换芯片,不仅压低了每比特能耗,还在设计层面整合了故障检测与冗余机制,才使得“正常运行时间 5 倍提升”成为量化表述。需要留意的是,此番量产主要围绕 Vera Rubin 平台的横向扩展网络,而非适配广泛第三方 GPU 的通用网络设备,这延续了英伟达“端到端封锁”的风格。

站在产业视角,此次量产对 AI 五层蛋糕中的 **基础设施层** 产生直接冲击,同时也向上拉动 **芯片层** 与 **应用层** 的效率天花板。对云服务商和企业自建集群而言,更低的功耗意味着相同电力配额下可部署更多算力,正常运行时间的提升则减少大规模训练中断带来的沉没成本和排队延迟。但同时,CPO 的供应链结构与传统光模块完全异质,将压缩可插拔光模块厂商的生存空间,加速光通信产业从模块级创新向晶圆级封装集成倾斜。这一转变的核心看点在于,它将“网络互连”这一曾经相对标准化的部件,更深地锁定在单个计算平台的架构护城河内。