一个由华为技术公司牵头的联合研究团队近日公布了一项重要进展:他们成功对DeepSeek的V4-Pro模型进行了全参数后训练。V4-Pro是一个参数规模达到1.6万亿的巨型模型,而此次训练的核心算力完全由华为自研的昇腾910C AI芯片提供,共动用了约1000颗芯片。这一消息由科技媒体Tom's Hardware率先报道,迅速在AI产业界引发关注。

所谓“后训练”,通常指在模型完成大规模预训练之后,通过有监督微调、强化学习或偏好对齐等技术,进一步提升模型在特定任务上的表现和安全性。对1.6万亿参数级别的模型进行全参数后训练,意味着需要同时更新模型的所有权重,这对算力集群的规模、稳定性和通信效率提出了极高要求。

华为昇腾910C是其AI芯片系列的最新成员,旨在对标业界顶尖的AI训练芯片。此前,业界对于国产AI芯片能否胜任千亿乃至万亿参数级别模型的训练任务,一直存在观望和疑虑。此次实践提供了一个具体的案例:在真实的大模型工作负载下,由昇腾芯片组成的集群不仅完成了训练,而且处理的是全参数更新,这比部分参数微调的技术难度更大。

从产业角度看,这一事件在“五层蛋糕”框架中,直接触及了芯片基础设施两层。它表明,围绕非英伟达体系构建的AI算力底座,正在从理论走向实用。对于DeepSeek而言,其模型在异构算力平台上得到验证,也拓宽了自身的部署和优化路径。

当然,这只是一次研究团队公布的技术成果,距离大规模商业化部署仍有距离。训练效率、成本、软件生态的成熟度以及长期稳定性,都是后续需要持续观察的维度。但无论如何,它向市场传递了一个信号:在通往万亿参数模型的道路上,算力供给的多元化正在加速成为现实。