护城河在漏水？老黄的 GPU 帝国，正被一群「自己造芯片」的客户包围

英伟达卖出了史上最赚钱的芯片，却养出了一桌最有钱、也最有动机绕开它的客户。

2026 年 6 月 3 日，博通公布 2026 财年第二季度财报：单季营收 222 亿美元、同比增长 48%，其中来自 AI 的半导体收入 108 亿美元、同比暴涨 143%，约占总营收的一半；经营利润率 67%，创历史新高，AI 芯片在手订单（backlog）超过 300 亿美元。^{^[1]^[2]}

这笔钱大半来自一件事：替谷歌、Meta、OpenAI 这些英伟达的头号大客户，设计并代工他们「自己的」AI 芯片。于是出现了一个耐人寻味的悖论——同一周里，英伟达刚交出数据中心单季 752 亿美元、同比 +92% 的纪录级财报，^{^[9]} 可它最大的几个买家，正一边下单买 GPU、一边掏钱造能替代 GPU 的芯片。

「读懂老黄」决定用「五层蛋糕」框架，把这场正在发生的围剿拆清楚：缺口为什么先出现在推理这一层、围剿阵营到底有多大、以及老黄的反制是不是真能补漏。这是本站「英伟达护城河观察」系列的第一篇。

一、为什么现在写：博通财报撕开的那道口子

把博通这份财报放到产业链里看，它其实是一张「英伟达大客户出逃地图」。

博通把这些为单一客户定制的 AI 加速器称作 XPU。按第三方统计，博通已拿下定制 AI 加速器市场约 70% 的份额，背后是谷歌 TPU、Meta MTIA 等多个长期项目。^{^[3]} 也就是说，当云巨头们决定「不只用英伟达」，它们第一个找的设计伙伴，往往就是博通。

更说明问题的是博通自己的指引：下季度（Q3）AI 半导体收入预计同比增长超过 200%、达到约 160 亿美元；公司重申 2027 财年 AI 半导体收入将超过 1000 亿美元。^{^[1]} 这条曲线背后，是一整代超大规模厂商把「自研芯片」从实验项目变成了主力路线。

这就是本文要回答的问题：当最赚钱的客户纷纷绕过 GPU，英伟达那条以 GPU + CUDA 筑起来的护城河，到底有没有在漏水？

二、结论先行

一句话：护城河确实被凿了一道口子，但口子开在「推理」这一层；英伟达的应对，是一边把定制芯片「收编」进自家机架，一边赶在客户之前、先把「自己的推理 ASIC」造了出来。

拆开看：

威胁是真的——博通 AI 营收一年涨 143%、订单簿超 300 亿；谷歌、OpenAI、Anthropic 都已把「非英伟达」算力做成了可规模化的现实。^{^[1]^[3]^[5]^[6]}
但量级仍悬殊——博通整个 2027 财年的 AI 营收目标（1000 亿美元）^{^[1]}，量级上仍只相当于英伟达数据中心业务单季 752 亿、年化约 3000 亿美元的一个零头多一点。^{^[9]}
战线很清楚——通用、要灵活的训练仍是 GPU 的主场；追求极致单位成本的推理，才是定制芯片（ASIC）的突破口。
老黄已经在补漏——Rubin CPX 专用推理芯片 + NVLink Fusion 开放机架 + 绑定 Marvell，三招齐下。^{^[10]^[12]^[14]}

这既是护城河被侵蚀的故事，也是一家公司主动把自己「ASIC 化」以守住护城河的故事——这是本文贯穿始终的张力。

三、围剿阵营点名（数据模块）

先把「谁在自己造芯片、造到哪一步」摆成一张表。

阵营	自研 / 定制芯片进度	设计伙伴	来源
谷歌 TPU	第七代双供应：训练版（代号 Sunfish）+ 推理版（代号 Zebrafish）；出货量 2026 年约 430 万颗、2028 年预计超 3500 万颗	博通（训练）/ 联发科（推理）/ Marvell	^{^[3]^[4]}
OpenAI	与博通合作 10GW 自研加速器，OpenAI 负责设计、博通负责系统与网络；采用 3nm／2nm 工艺，2026 下半年首批部署、2029 完成	博通	^{^[5]}
Anthropic	最多 100 万颗 TPU、超 1GW 算力（2025-10）；2026-04 进一步签下 5GW 下一代 TPU（2027 起）；同时跨用 AWS Trainium + 英伟达 GPU + 谷歌 TPU 三套平台	谷歌 / 博通	^{^[6]^[7]}
亚马逊 / 微软 / Meta	Trainium、Maia、MTIA 各自迭代，均走「自研 + 博通/Marvell 代工」路线	博通 / Marvell	^{^[3]}

把这张表连起来看，结论很直白：英伟达数据中心营收里占大头的超大规模客户，几乎每一家都在认真做「第二供应商」，而且第二供应商往往是自己。^{^[3]} 这不是某一家的赌气，而是一场结构性的「去单一供应商化」。

其中最有标志性意义的是 Anthropic：它把谷歌 TPU 作为训练前沿模型 Claude 的主力算力底座之一，等于公开验证了「不靠英伟达也能训出前沿大模型」这条路是走得通的。^{^[6]} 对一个长期靠「CUDA 是唯一可靠选择」立身的生态来说，这种示范效应，比任何一张订单都更刺痛。

四、为什么缺口先开在「推理」

要理解这道口子，得先分清 AI 算力的两种活：训练和推理。

训练是把模型「教出来」：算法天天变、架构反复试，最吃「通用 + 灵活」。GPU 什么都能跑，叠加 CUDA 十几年积累的软件生态，这一层英伟达的优势短期难撼。
推理是把训练好的模型「拿去用」：一旦模型定型、开始大规模对外服务，工作负载就变得重复、可预测。这时客户最在意的不再是灵活，而是每生成一个 token 的成本。

而定制 ASIC 的全部优势，恰恰在「重复、可预测、追求极致单位成本」的场景里。第三方测算显示，在生产级推理上，定制硅相对通用 GPU 的总拥有成本（TCO）优势可达约 65%；研究机构 TrendForce 则预计，2026 年定制芯片出货增速约 45%，而 GPU 出货增速约 16%。^{^[8]}

把这层逻辑放回「五层蛋糕」，缺口的位置就清晰了：

基础设施层（infra）——当算力从「建集群、做训练」转向「铺产能、做服务」，部署的核算口径从「峰值算力」变成「单位推理成本」，定制芯片的账一下子算得过来了。
模型层（models）——前沿模型逐渐定型、开源模型批量可用，「训练」的边际需求增速放缓，而「服务」的需求开始指数级放大。
应用层（apps）——智能体（agentic AI）真正放量后，token 消耗是按「亿级调用」计的；在这个量级上，哪怕单 token 成本只降两三成，省下的也是天文数字。

换句话说：正是黄仁勋自己反复讲的「算力即营收（compute is revenue）」叙事走向成熟，把战场从英伟达最强的训练，推向了它相对最容易被替代的推理。 客户越是把 AI 用成生意，就越有动机为推理这道工序，配一颗更便宜的专用芯片。

五、老黄的三道反制

英伟达没有装作看不见。过去一年，它的应对可以拆成三招，而且三招都很「老黄」——核心不是把对手挡在门外，而是确保无论客户怎么选，英伟达都在那张机架里留着一个收费口。

反制一：自己先造一颗「推理 ASIC」——Rubin CPX

最直接的一招，是英伟达干脆赶在客户之前，把「专用推理芯片」自己造了出来。

2026 年，英伟达发布 Rubin CPX：一颗专为超长上下文（100 万+ token）推理优化的新型 GPU，主打 30 petaFLOPs 的 NVFP4 算力，注意力（attention）处理较上一代 GB300 NVL72 提速约 3×，计划 2026 年底上市。^{^[10]^[11]} 有评论一针见血：Rubin CPX 牺牲了训练的通用灵活性、换取 token 服务效率，本质上就是英伟达在客户造出自己的 ASIC 之前，先造了一颗自己的 ASIC。^{^[13]}

配合下一代 Vera Rubin 平台，英伟达对外给出的承诺是把推理成本压低约 10×——直接对着定制芯片最锋利的那把刀（TCO）去的。^{^[13]}

提示：上述「10×」「3×」均为英伟达官方或第三方评测口径的厂商目标值，独立第三方大规模实测尚未跟上，不代表本文立场，也不构成任何投资判断。

反制二：拦不住，就「收编」——NVLink Fusion

第二招更见功力。既然云巨头铁了心要用自己的 ASIC，英伟达索性推出 NVLink Fusion：一个开放的机架级平台，让客户把半定制的 ASIC 直接插进英伟达的互联与网络生态里。^{^[12]}

在这套方案里，Marvell 提供定制 XPU 与兼容 NVLink Fusion 的扩展网络，而英伟达继续供应 Vera CPU、ConnectX 网卡、BlueField DPU、NVLink 互联与 Spectrum-X 交换。^{^[12]} 翻译成大白话：就算这台机架里的「主芯片」不是英伟达 GPU，英伟达照样卖 CPU、卖网络、卖互联、收一笔「过路费」。 客户的 ASIC 越是要规模化组网，就越难绕开英伟达的机架级生态。

这正是「读懂老黄」一直强调的「占位—收租」逻辑：份额可以被蚕食，但英伟达要在每一层都留一个收费口。

反制三：把第二名拉进自己阵营——绑定 Marvell

第三招是结盟。定制芯片的另一极是 Marvell，英伟达选择投资并公开站台：黄仁勋在 Computex 2026 期间称 Marvell 有望成为「下一家万亿美元公司」。^{^[14]}

提示：「下一家万亿美元公司」是黄仁勋的个人评价、属第三方观点，不代表本文立场，本文不提供任何买卖建议或目标价。

把博通的头号竞争对手拉进 NVLink Fusion 生态，既分化了定制芯片阵营，又给英伟达自己的「收租」机架补上了关键一环。这一手的算盘很清楚：与其让定制芯片完全长在博通体系里，不如让其中一支长在英伟达的机架上。

六、量级校准与反方（防一边倒）

讲到这里，必须把天平摆正——「护城河漏水」是一个有分寸的判断，不是「帝国将倾」。

量级仍然悬殊。 博通整个 2027 财年的 AI 营收目标是 1000 亿美元^{^[1]}，而英伟达单季数据中心营收已达 752 亿、年化约 3000 亿美元。^{^[9]} 即便把博通的 AI 收入全部算作「抢英伟达的蛋糕」（事实上其中相当部分是 AI 网络、并非直接替代 GPU），量级上也只是英伟达的一个零头多一点。
增速快，但基数小。 定制芯片 45% 的出货增速确实远高于 GPU 的 16%^{^[8]}，但这是从一个小得多的基数起跳；高增速能维持几年、会不会随云资本开支波动而回落，仍要后续季度数据验证。
CUDA 生态仍是真护城河。 客户能自研芯片，不代表能轻松复制十几年沉淀的软件栈、编译器、算子库与开发者习惯。ASIC 通常只服务单一客户、单一工作负载，一旦模型架构跳变，灵活性短板就会暴露——这也是为什么训练侧至今没有被撼动。
「自研」未必等于「断奶」。 Anthropic 的做法很典型：TPU、英伟达 GPU、AWS Trainium 三套并用。^{^[6]^[7]} 多数巨头要的是「议价权」和「第二供应商」，而非真把英伟达踢出去。

所以更准确的说法是：英伟达不会被定制芯片掀翻，但它在推理这一层「独占式」的定价权，正在被结构性地侵蚀——而定价权，恰恰是过去几年支撑其 75% 级别毛利率的关键。^{^[9]}

七、对产业链意味着什么（五层视角，不构成投资建议）

先把话说在前面：本文不构成任何投资建议，也不提供目标价。 我们只做一件事——把这场「围剿与反制」还原成产业链上的因果。

从「五层蛋糕」看，这场博弈正在重塑 chips→infra→models 三层的利益分配，可以情景化地（以下均为产业推演、非预测，第三方数据已归因）这样理解：

被抬升的环节——定制芯片的设计与代工方（博通、Marvell）、以及承接 TPU／XPU 制造的代工与封装链，会随「去单一供应商化」直接受益；这从博通 AI 营收 +143%、订单簿超 300 亿已能看到旁证。^{^[1]^[3]}
被重新定价的环节——英伟达在推理芯片上的超额定价权面临压力，这也是它主动推出 Rubin CPX、用「成本叙事」迎战的原因。^{^[10]^[13]}
格局未变的环节——训练侧、以及机架级的 CPU／网络／互联（Vera CPU、Spectrum-X、NVLink），英伟达通过 NVLink Fusion 把「替代」转化成了「共生」，反而可能在客户用 ASIC 的同时继续收租。^{^[12]}

我们更愿意提示的是结构性问题，而非某一天的股价：当客户从「只能买英伟达」变成「能买、能租、也能自己造」，真正值得长期追踪的，不是 GPU 卖了多少，而是英伟达能不能在推理这道新战场上，把「占位」继续转化为「收租」。这正是「英伟达护城河观察」系列接下来要持续盯的事。

八、反方与不确定性

「投产」≠「放量」。 Rubin CPX 官方口径是 2026 年底上市，真实出货曲线、良率与客户采纳节奏，仍需后续季度验证。^{^[10]}
自研芯片同样有兑现风险。 OpenAI 的 10GW 计划要到 2029 年才完成^{^[5]}，谷歌 TPU 的 3500 万颗出货是 2028 年的预测^{^[4]}；这些长周期目标都可能因资本开支、产能或良率而打折。
厂商口径需打折看。 文中「10×」「3×」「65% TCO」等均来自厂商或第三方测算，独立大规模实测尚未跟上，应保守解读。
政策与宏观变量。 出口管制、云资本开支周期都会改变这场博弈的节奏，本文未展开。

结语

Computex 之后，我们说「再用『一家 GPU 公司』概括英伟达已经不够了」。这篇可以补一句：英伟达正在亲手把自己变成一家「也卖推理 ASIC、也卖机架、也卖网络」的全栈收租者——因为它比谁都清楚，护城河最先漏水的地方在哪里。

博通们的围剿是真的，推理这道口子也是真的；但老黄显然没打算站着挨打，而是一边自造 ASIC、一边把对手的 ASIC 收进自己的机架。护城河会不会漏水，最终取决于推理这道闸守不守得住——而这，正是我们这个系列要替你长期盯住的地方。

一、为什么现在写：博通财报撕开的那道口子

二、结论先行

三、围剿阵营点名（数据模块）

四、为什么缺口先开在「推理」

五、老黄的三道反制

反制一：自己先造一颗「推理 ASIC」——Rubin CPX

反制二：拦不住，就「收编」——NVLink Fusion

反制三：把第二名拉进自己阵营——绑定 Marvell

六、量级校准与反方（防一边倒）

七、对产业链意味着什么（五层视角，不构成投资建议）

八、反方与不确定性

结语

延伸阅读

参考来源

一、为什么现在写：博通财报撕开的那道口子

二、结论先行

三、围剿阵营点名（数据模块）

四、为什么缺口先开在「推理」

五、老黄的三道反制

反制一：自己先造一颗「推理 ASIC」——Rubin CPX

反制二：拦不住，就「收编」——NVLink Fusion

反制三：把第二名拉进自己阵营——绑定 Marvell

六、量级校准与反方（防一边倒）

七、对产业链意味着什么（五层视角，不构成投资建议）

八、反方与不确定性

结语

延伸阅读

参考来源

相关百科

相关每日新闻