华为团队用昇腾910C完成DeepSeek 1.6万亿参数模型后训练

华为团队称用1000块昇腾910C完成DeepSeek V4-Pro的1.6万亿参数后训练

一个由华为技术公司牵头的联合研究团队近日公布了一项重要进展：他们成功对DeepSeek的V4-Pro模型进行了全参数后训练。V4-Pro是一个参数规模达到1.6万亿的巨型模型，而此次训练的核心算力完全由华为自研的昇腾910C AI芯片提供，共动用了约1000颗芯片。这一消息由科技媒体Tom's Hardware率先报道，迅速在AI产业界引发关注。

所谓“后训练”，通常指在模型完成大规模预训练之后，通过有监督微调、强化学习或偏好对齐等技术，进一步提升模型在特定任务上的表现和安全性。对1.6万亿参数级别的模型进行全参数后训练，意味着需要同时更新模型的所有权重，这对算力集群的规模、稳定性和通信效率提出了极高要求。

华为昇腾910C是其AI芯片系列的最新成员，旨在对标业界顶尖的AI训练芯片。此前，业界对于国产AI芯片能否胜任千亿乃至万亿参数级别模型的训练任务，一直存在观望和疑虑。此次实践提供了一个具体的案例：在真实的大模型工作负载下，由昇腾芯片组成的集群不仅完成了训练，而且处理的是全参数更新，这比部分参数微调的技术难度更大。

从产业角度看，这一事件在“五层蛋糕”框架中，直接触及了芯片和基础设施两层。它表明，围绕非英伟达体系构建的AI算力底座，正在从理论走向实用。对于DeepSeek而言，其模型在异构算力平台上得到验证，也拓宽了自身的部署和优化路径。

当然，这只是一次研究团队公布的技术成果，距离大规模商业化部署仍有距离。训练效率、成本、软件生态的成熟度以及长期稳定性，都是后续需要持续观察的维度。但无论如何，它向市场传递了一个信号：在通往万亿参数模型的道路上，算力供给的多元化正在加速成为现实。

华为团队用昇腾910C完成DeepSeek 1.6万亿参数模型后训练

延伸阅读

相关每日新闻