英伟达约 75% 的毛利率,是 AI 时代最惊人的数字之一。它不全来自芯片有多好,也来自一个朴素的事实:过去两年,你想买 AI 算力,几乎只能买它——而且还得排队。

这是本系列的收官篇。前三篇我们拆了英伟达护城河的三个切面:硬件被定制 ASIC 围剿、软件 CUDA 被抽象层架空、推理的单位经济学重写战场。这一篇收到最现实的一处——钱袋子:当稀缺不再,英伟达那道靠「买不到」撑起来的定价权,还剩多少?

一、定价权的两根支柱

英伟达能维持约 75% 的毛利率,[9] 靠的是两根支柱叠在一起:

  • 技术领先——更强的架构、CUDA 生态、NVLink 到机架的全栈整合,让它能卖出溢价;
  • 供给稀缺——过去两年,几乎每家想训大模型的公司都需要英伟达 GPU,而它产不够。当「人人都要、又买不到」叠加,定价权近乎绝对。[1]

关键在于第二根:稀缺。技术领先能解释「为什么贵」,但稀缺才解释「为什么能这么贵还供不应求」。一旦稀缺松动,溢价里靠「排队」撑着的那部分,就会开始折旧。

二、结论先行

一句话:技术那根支柱还稳,但供给稀缺这根,第一次开始松动——第二供应商(AMD)拿到了超大单、自研 ASIC 从下方夹击、产能逐渐追上需求。价格战不会从旗舰训练卡烧起(那里仍是卖方市场),而会先从『推理』和『上一代/中端卡』点火。

拆开看:

  • 稀缺在松——Meta 给 AMD MI450 押下约 600 亿美元的多年承诺,是「英伟达不再是唯一选项」的最强信号。[2][3]
  • 价格战先烧推理——推理对性价比最敏感,也是 AMD 与定制 ASIC 性价比最接近的地方。[4][10]
  • 但旗舰仍稀缺——最前沿的训练卡(Blackwell/Rubin)短期仍供不应求,溢价稳固。
  • 英伟达护价靠「卖系统」——不单卖芯片,而是把 GPU 锁进 CUDA + NVLink + 机架的整套里,让单卡降价无从比起。[11]

三、稀缺松动的证据(数据模块)

信号数字来源
英伟达份额与体量约 80% AI 加速器份额;FY2026 数据中心营收约 1937 亿美元[1]
AMD 追赶Instinct 系列 2025 年营收估约 70~80 亿美元、份额约 5%~7%[1]
Meta 押注 AMDMI450 多年承诺约 6GW、价值约 600 亿美元;OpenAI 亦承诺约 6GW[2][3]
云端租赁分层超大规模云(Azure/Oracle)的 MI300X 租赁价,约为小众云的 3~4 倍[5]
资本市场情绪AMD 2026 年内股价涨约 114%(第三方统计,不代表本文立场)[8]

把这些连起来看:英伟达的份额仍占绝对主导,但**「唯一供应商」的叙事正在被改写**——当 Meta 这样的超大买家敢把 6GW 押给 AMD,稀缺的城墙就出现了第一道缝。

四、价格战会从哪里先烧起

价格战不是「全线降价」,而是从最薄弱处点火:

  • 推理侧最先。 推理负载对每百万 token 成本极敏感,AMD 与定制 ASIC 在这里的性价比最接近英伟达。有评测(SemiAnalysis)专门比较 AMD 与英伟达在推理上的「每百万 token 成本」,正说明买家已经在按这把尺子选货。[4][10]
  • 上一代与中端卡。 随着新架构投产,上一代 GPU 价格松动,公开的 GPU 价格追踪已能看到这种压力。[6][7]
  • 旗舰训练卡仍是卖方市场。 最前沿的训练算力短期仍供不应求,英伟达在这里仍掌握定价权——价格战暂时烧不到这块。

换句话说:英伟达的「价格地板」会从底部和中部被慢慢抬走,但「价格天花板」(旗舰)暂时还焊得很牢。

五、英伟达怎么护价

面对价格压力,英伟达护价的手段不是「降价跟」,而是「让你没法只比价格」:

  • CUDA 锁定——换芯片=换整套软件栈,迁移成本高,这是上一篇讲的护城河,也是护价的底盘。[11]
  • 卖系统,不卖单芯片——把 GPU 锁进 NVLink、Spectrum-X、机架系统里整体报价,让「单卡多少钱」变得无从直接比较,议价锚定在整机价值上。
  • 保持代差——年度节奏(Blackwell → Rubin)让对手永远在追上一代,技术溢价持续再生。
  • 把竞争拉到 cost per token——如上一篇所述,用全栈优化把比较维度从「单卡价格」换成「每 token 总成本」,这是英伟达最能发挥规模优势的赛道。

这套打法的内核,仍是首篇那句「每一层占位、每一层收租」:只要英伟达卖的是一整套系统,单点的价格战就很难真正伤到它的毛利。

六、量级校准与反方(防一边倒)

  • 大单未必等于降价。 Meta、OpenAI 押注 AMD,更多是「供应链多元化」与「议价筹码」,不直接等同于英伟达大幅降价;英伟达完全可能选择守价、以让出部分份额来保住毛利。[2]
  • 份额仍然悬殊。 英伟达约 80% 对 AMD 个位数的份额,量级差距巨大;AMD 的高增速是从小基数起跳。[1]
  • 技术与生态代差仍在。 CUDA 黏性、全栈整合、代际领先,仍是英伟达护价的硬底盘,短期难被价格单独击穿。[11]
  • 但「稀缺溢价」确实在折旧。 当产能追上、第二供应商可用、定制 ASIC 从下方压价[12],英伟达毛利里靠「买不到」撑着的那一部分,会随时间慢慢褪色——这是结构性的、不可逆的方向。

更准确的说法是:英伟达不会打输价格战,但它可能要在「守份额」与「守毛利」之间,第一次做出取舍。

七、五层视角:价格如何沿五层传导

从「五层蛋糕」看,芯片层的价格变化会沿链条传导:

  • 向上(infra)——GPU 与系统的单位成本,直接决定 AI 工厂的 capex 与单位 token 成本;价格松动会改变数据中心的选型与扩产节奏;
  • 向下(供应链)——价格战压力会传导到 HBM、CoWoS 封装、代工等上游,谁有定价权、谁被挤压,跟着重排;
  • 横向(竞争格局)——AMD、定制 ASIC、英伟达三方的价格博弈,最终决定这一代 AI 资本开支「花得值不值」。

这正是「读懂老黄」坚持五层框架的意义:一颗 GPU 的报价,从来不只是芯片层的事,它牵动着从能源到应用的整条账本。

结语:四面墙,一座城

到这里,「英伟达护城河观察」第一季的四篇凑齐了:

  • 硬件被定制 ASIC 围剿(首篇);
  • 软件护城河 CUDA 被抽象层架空(第二篇);
  • 推理经济学把战场从「最快」改写成「最便宜的 token」(第三篇);
  • 定价权的稀缺支柱开始松动(本篇)。

四面墙各有裂缝,但合起来仍是一座难攻的城。英伟达真正的本事,从来不是某一面墙最高,而是四面墙互为支撑:硬件养生态、生态锁客户、客户撑定价、定价反哺研发。这一季我们拆的是裂缝;下一季,我们会接着盯——这些裂缝,究竟是会扩大成缺口,还是被老黄用「占位—收租」一次次补上。

延伸阅读