是什么

NVLink 是英伟达推出的高速互联技术,用于在多颗 GPU 之间,以及 GPU 与 CPU 之间建立远高于传统 PCIe 的点对点带宽连接。配合 NVSwitch 交换芯片,它可以把机柜内的多颗 GPU 连成一个高带宽、低延迟的整体,使它们能够高效地共享数据与协同计算。

为什么重要

现代大型 AI 模型的参数规模早已超出单颗 GPU 的承载能力,必须把计算切分到成百上千颗 GPU 上并行完成。此时芯片之间的数据交换速度,往往比单颗算力更能决定整体效率。NVLink 提供的高带宽互联,让大量 GPU 在物理上分立、在逻辑上趋近于一颗「超级芯片」,是大规模训练能够高效扩展的前提之一。

与五层蛋糕的关系

NVLink 位于「五层蛋糕」的「芯片」层,但作用延伸到「基础设施」层。它把单颗芯片的算力,通过互联汇聚成机柜乃至集群级别的算力,直接支撑上方「模型」层的大规模分布式训练。互联能力与芯片本身,共同决定了一个 AI 工厂究竟能调动多大的有效算力。