英伟达卖出了史上最赚钱的芯片,却养出了一桌最有钱、也最有动机绕开它的客户。
2026 年 6 月 3 日,博通公布 2026 财年第二季度财报:单季营收 222 亿美元、同比增长 48%,其中来自 AI 的半导体收入 108 亿美元、同比暴涨 143%,约占总营收的一半;经营利润率 67%,创历史新高,AI 芯片在手订单(backlog)超过 300 亿美元。[1][2]
这笔钱大半来自一件事:替谷歌、Meta、OpenAI 这些英伟达的头号大客户,设计并代工他们「自己的」AI 芯片。于是出现了一个耐人寻味的悖论——同一周里,英伟达刚交出数据中心单季 752 亿美元、同比 +92% 的纪录级财报,[9] 可它最大的几个买家,正一边下单买 GPU、一边掏钱造能替代 GPU 的芯片。
「读懂老黄」决定用「五层蛋糕」框架,把这场正在发生的围剿拆清楚:缺口为什么先出现在推理这一层、围剿阵营到底有多大、以及老黄的反制是不是真能补漏。这是本站「英伟达护城河观察」系列的第一篇。
一、为什么现在写:博通财报撕开的那道口子
把博通这份财报放到产业链里看,它其实是一张「英伟达大客户出逃地图」。
博通把这些为单一客户定制的 AI 加速器称作 XPU。按第三方统计,博通已拿下定制 AI 加速器市场约 70% 的份额,背后是谷歌 TPU、Meta MTIA 等多个长期项目。[3] 也就是说,当云巨头们决定「不只用英伟达」,它们第一个找的设计伙伴,往往就是博通。
更说明问题的是博通自己的指引:下季度(Q3)AI 半导体收入预计同比增长超过 200%、达到约 160 亿美元;公司重申 2027 财年 AI 半导体收入将超过 1000 亿美元。[1] 这条曲线背后,是一整代超大规模厂商把「自研芯片」从实验项目变成了主力路线。
这就是本文要回答的问题:当最赚钱的客户纷纷绕过 GPU,英伟达那条以 GPU + CUDA 筑起来的护城河,到底有没有在漏水?
二、结论先行
一句话:护城河确实被凿了一道口子,但口子开在「推理」这一层;英伟达的应对,是一边把定制芯片「收编」进自家机架,一边赶在客户之前、先把「自己的推理 ASIC」造了出来。
拆开看:
- 威胁是真的——博通 AI 营收一年涨 143%、订单簿超 300 亿;谷歌、OpenAI、Anthropic 都已把「非英伟达」算力做成了可规模化的现实。[1][3][5][6]
- 但量级仍悬殊——博通整个 2027 财年的 AI 营收目标(1000 亿美元)[1],量级上仍只相当于英伟达数据中心业务单季 752 亿、年化约 3000 亿美元的一个零头多一点。[9]
- 战线很清楚——通用、要灵活的训练仍是 GPU 的主场;追求极致单位成本的推理,才是定制芯片(ASIC)的突破口。
- 老黄已经在补漏——Rubin CPX 专用推理芯片 + NVLink Fusion 开放机架 + 绑定 Marvell,三招齐下。[10][12][14]
这既是护城河被侵蚀的故事,也是一家公司主动把自己「ASIC 化」以守住护城河的故事——这是本文贯穿始终的张力。
三、围剿阵营点名(数据模块)
先把「谁在自己造芯片、造到哪一步」摆成一张表。
| 阵营 | 自研 / 定制芯片进度 | 设计伙伴 | 来源 |
|---|---|---|---|
| 谷歌 TPU | 第七代 双供应:训练版(代号 Sunfish)+ 推理版(代号 Zebrafish);出货量 2026 年约 430 万颗、2028 年预计超 3500 万颗 | 博通(训练)/ 联发科(推理)/ Marvell | [3][4] |
| OpenAI | 与博通合作 10GW 自研加速器,OpenAI 负责设计、博通负责系统与网络;采用 3nm/2nm 工艺,2026 下半年首批部署、2029 完成 | 博通 | [5] |
| Anthropic | 最多 100 万颗 TPU、超 1GW 算力(2025-10);2026-04 进一步签下 5GW 下一代 TPU(2027 起);同时跨用 AWS Trainium + 英伟达 GPU + 谷歌 TPU 三套平台 | 谷歌 / 博通 | [6][7] |
| 亚马逊 / 微软 / Meta | Trainium、Maia、MTIA 各自迭代,均走「自研 + 博通/Marvell 代工」路线 | 博通 / Marvell | [3] |
把这张表连起来看,结论很直白:英伟达数据中心营收里占大头的超大规模客户,几乎每一家都在认真做「第二供应商」,而且第二供应商往往是自己。[3] 这不是某一家的赌气,而是一场结构性的「去单一供应商化」。
其中最有标志性意义的是 Anthropic:它把谷歌 TPU 作为训练前沿模型 Claude 的主力算力底座之一,等于公开验证了「不靠英伟达也能训出前沿大模型」这条路是走得通的。[6] 对一个长期靠「CUDA 是唯一可靠选择」立身的生态来说,这种示范效应,比任何一张订单都更刺痛。
四、为什么缺口先开在「推理」
要理解这道口子,得先分清 AI 算力的两种活:训练和推理。
- 训练是把模型「教出来」:算法天天变、架构反复试,最吃「通用 + 灵活」。GPU 什么都能跑,叠加 CUDA 十几年积累的软件生态,这一层英伟达的优势短期难撼。
- 推理是把训练好的模型「拿去用」:一旦模型定型、开始大规模对外服务,工作负载就变得重复、可预测。这时客户最在意的不再是灵活,而是每生成一个 token 的成本。
而定制 ASIC 的全部优势,恰恰在「重复、可预测、追求极致单位成本」的场景里。第三方测算显示,在生产级推理上,定制硅相对通用 GPU 的总拥有成本(TCO)优势可达约 65%;研究机构 TrendForce 则预计,2026 年定制芯片出货增速约 45%,而 GPU 出货增速约 16%。[8]
把这层逻辑放回「五层蛋糕」,缺口的位置就清晰了:
- 基础设施层(infra)——当算力从「建集群、做训练」转向「铺产能、做服务」,部署的核算口径从「峰值算力」变成「单位推理成本」,定制芯片的账一下子算得过来了。
- 模型层(models)——前沿模型逐渐定型、开源模型批量可用,「训练」的边际需求增速放缓,而「服务」的需求开始指数级放大。
- 应用层(apps)——智能体(agentic AI)真正放量后,token 消耗是按「亿级调用」计的;在这个量级上,哪怕单 token 成本只降两三成,省下的也是天文数字。
换句话说:正是黄仁勋自己反复讲的「算力即营收(compute is revenue)」叙事走向成熟,把战场从英伟达最强的训练,推向了它相对最容易被替代的推理。 客户越是把 AI 用成生意,就越有动机为推理这道工序,配一颗更便宜的专用芯片。
五、老黄的三道反制
英伟达没有装作看不见。过去一年,它的应对可以拆成三招,而且三招都很「老黄」——核心不是把对手挡在门外,而是确保无论客户怎么选,英伟达都在那张机架里留着一个收费口。
反制一:自己先造一颗「推理 ASIC」——Rubin CPX
最直接的一招,是英伟达干脆赶在客户之前,把「专用推理芯片」自己造了出来。
2026 年,英伟达发布 Rubin CPX:一颗专为超长上下文(100 万+ token)推理优化的新型 GPU,主打 30 petaFLOPs 的 NVFP4 算力,注意力(attention)处理较上一代 GB300 NVL72 提速约 3×,计划 2026 年底上市。[10][11] 有评论一针见血:Rubin CPX 牺牲了训练的通用灵活性、换取 token 服务效率,本质上就是英伟达在客户造出自己的 ASIC 之前,先造了一颗自己的 ASIC。[13]
配合下一代 Vera Rubin 平台,英伟达对外给出的承诺是把推理成本压低约 10×——直接对着定制芯片最锋利的那把刀(TCO)去的。[13]
提示:上述「10×」「3×」均为英伟达官方或第三方评测口径的厂商目标值,独立第三方大规模实测尚未跟上,不代表本文立场,也不构成任何投资判断。
反制二:拦不住,就「收编」——NVLink Fusion
第二招更见功力。既然云巨头铁了心要用自己的 ASIC,英伟达索性推出 NVLink Fusion:一个开放的机架级平台,让客户把半定制的 ASIC 直接插进英伟达的互联与网络生态里。[12]
在这套方案里,Marvell 提供定制 XPU 与兼容 NVLink Fusion 的扩展网络,而英伟达继续供应 Vera CPU、ConnectX 网卡、BlueField DPU、NVLink 互联与 Spectrum-X 交换。[12] 翻译成大白话:就算这台机架里的「主芯片」不是英伟达 GPU,英伟达照样卖 CPU、卖网络、卖互联、收一笔「过路费」。 客户的 ASIC 越是要规模化组网,就越难绕开英伟达的机架级生态。
这正是「读懂老黄」一直强调的「占位—收租」逻辑:份额可以被蚕食,但英伟达要在每一层都留一个收费口。
反制三:把第二名拉进自己阵营——绑定 Marvell
第三招是结盟。定制芯片的另一极是 Marvell,英伟达选择投资并公开站台:黄仁勋在 Computex 2026 期间称 Marvell 有望成为「下一家万亿美元公司」。[14]
提示:「下一家万亿美元公司」是黄仁勋的个人评价、属第三方观点,不代表本文立场,本文不提供任何买卖建议或目标价。
把博通的头号竞争对手拉进 NVLink Fusion 生态,既分化了定制芯片阵营,又给英伟达自己的「收租」机架补上了关键一环。这一手的算盘很清楚:与其让定制芯片完全长在博通体系里,不如让其中一支长在英伟达的机架上。
六、量级校准与反方(防一边倒)
讲到这里,必须把天平摆正——「护城河漏水」是一个有分寸的判断,不是「帝国将倾」。
- 量级仍然悬殊。 博通整个 2027 财年的 AI 营收目标是 1000 亿美元[1],而英伟达单季数据中心营收已达 752 亿、年化约 3000 亿美元。[9] 即便把博通的 AI 收入全部算作「抢英伟达的蛋糕」(事实上其中相当部分是 AI 网络、并非直接替代 GPU),量级上也只是英伟达的一个零头多一点。
- 增速快,但基数小。 定制芯片 45% 的出货增速确实远高于 GPU 的 16%[8],但这是从一个小得多的基数起跳;高增速能维持几年、会不会随云资本开支波动而回落,仍要后续季度数据验证。
- CUDA 生态仍是真护城河。 客户能自研芯片,不代表能轻松复制十几年沉淀的软件栈、编译器、算子库与开发者习惯。ASIC 通常只服务单一客户、单一工作负载,一旦模型架构跳变,灵活性短板就会暴露——这也是为什么训练侧至今没有被撼动。
- 「自研」未必等于「断奶」。 Anthropic 的做法很典型:TPU、英伟达 GPU、AWS Trainium 三套并用。[6][7] 多数巨头要的是「议价权」和「第二供应商」,而非真把英伟达踢出去。
所以更准确的说法是:英伟达不会被定制芯片掀翻,但它在推理这一层「独占式」的定价权,正在被结构性地侵蚀——而定价权,恰恰是过去几年支撑其 75% 级别毛利率的关键。[9]
七、对产业链意味着什么(五层视角,不构成投资建议)
先把话说在前面:本文不构成任何投资建议,也不提供目标价。 我们只做一件事——把这场「围剿与反制」还原成产业链上的因果。
从「五层蛋糕」看,这场博弈正在重塑 chips→infra→models 三层的利益分配,可以情景化地(以下均为产业推演、非预测,第三方数据已归因)这样理解:
- 被抬升的环节——定制芯片的设计与代工方(博通、Marvell)、以及承接 TPU/XPU 制造的代工与封装链,会随「去单一供应商化」直接受益;这从博通 AI 营收 +143%、订单簿超 300 亿已能看到旁证。[1][3]
- 被重新定价的环节——英伟达在推理芯片上的超额定价权面临压力,这也是它主动推出 Rubin CPX、用「成本叙事」迎战的原因。[10][13]
- 格局未变的环节——训练侧、以及机架级的 CPU/网络/互联(Vera CPU、Spectrum-X、NVLink),英伟达通过 NVLink Fusion 把「替代」转化成了「共生」,反而可能在客户用 ASIC 的同时继续收租。[12]
我们更愿意提示的是结构性问题,而非某一天的股价:当客户从「只能买英伟达」变成「能买、能租、也能自己造」,真正值得长期追踪的,不是 GPU 卖了多少,而是英伟达能不能在推理这道新战场上,把「占位」继续转化为「收租」。 这正是「英伟达护城河观察」系列接下来要持续盯的事。
八、反方与不确定性
- 「投产」≠「放量」。 Rubin CPX 官方口径是 2026 年底上市,真实出货曲线、良率与客户采纳节奏,仍需后续季度验证。[10]
- 自研芯片同样有兑现风险。 OpenAI 的 10GW 计划要到 2029 年才完成[5],谷歌 TPU 的 3500 万颗出货是 2028 年的预测[4];这些长周期目标都可能因资本开支、产能或良率而打折。
- 厂商口径需打折看。 文中「10×」「3×」「65% TCO」等均来自厂商或第三方测算,独立大规模实测尚未跟上,应保守解读。
- 政策与宏观变量。 出口管制、云资本开支周期都会改变这场博弈的节奏,本文未展开。
结语
Computex 之后,我们说「再用『一家 GPU 公司』概括英伟达已经不够了」。这篇可以补一句:英伟达正在亲手把自己变成一家「也卖推理 ASIC、也卖机架、也卖网络」的全栈收租者——因为它比谁都清楚,护城河最先漏水的地方在哪里。
博通们的围剿是真的,推理这道口子也是真的;但老黄显然没打算站着挨打,而是一边自造 ASIC、一边把对手的 ASIC 收进自己的机架。护城河会不会漏水,最终取决于推理这道闸守不守得住——而这,正是我们这个系列要替你长期盯住的地方。
延伸阅读
- 本专题的「全景起点」:Computex 2026 总纲:黄仁勋把 AI『五层蛋糕』摞齐了 —— 看英伟达如何在每一层落子。
- 同一条供应链的另一面:HBM 与 SK 海力士 —— AI 内存的瓶颈与格局。
- 想看英伟达的上下游与投资版图:英伟达生态图谱
/nvidia—— 上游供应链 + 下游客户 + 投资组合追踪。