英特尔拟年底前推新AI芯片：主打推理，内存与风冷更便宜

英特尔计划年底前推出Crescent Island推理芯片，采用低价内存与风冷技术。

英特尔正在用一套更务实的芯片策略杀回AI加速器战场。据多家媒体报道，公司计划在2024年年底前正式推出新一代AI图像处理器“Crescent Island”，直指推理工作负载，并刻意在硬件设计上与英伟达、AMD的主流产品拉开距离：**不使用高带宽内存，改用成本更低的普通内存；冷却系统也回归传统风冷，而非复杂的液冷方案**。领导英特尔数据中心业务的 Kevork Kechichian 对外阐释了这一思路，称团队正“从基础入手”重新审视推理芯片的架构，希望以更易部署、总拥有成本更低的方案打动云厂商与企业客户。

尽管目前英伟达的H100、B200系列在AI训练市场几乎占据了不可撼动的地位，但推理的爆发式增长正在打开另一扇窗。推理是指模型完成训练后，响应用户每一次提问、生成每一段文本或图像的过程，其芯片需求与训练有着本质不同：对绝对峰值算力的要求有所降低，但对吞吐量、延迟以及单位功耗成本异常敏感。在新一轮大模型潮涌中，推理需求正随应用落地急剧攀升，使得专门为推理优化的芯片商业前景快速放大。英特尔此次押注的正是这一差异化窗口。

从技术背景看，英伟达的Hopper和即将量产的Blackwell架构采用HBM3e高带宽内存和精密液冷，以实现极致训练性能，但这也带来了高昂的物料与运维成本。而“Crescent Island”通过回归更廉价的DDR类或类似标准内存，以及只用风冷散热，牺牲了一部分理论峰值性能，却大幅压缩了单卡成本与服务器集群的散热功耗预算。这种取舍在推理场景中可能成立，因为推理卡更多需要并行跑海量轻量请求，而非持续满负载运转。

对AI产业而言，这一动向有着明显的“五层蛋糕”含义。它首先直接作用于**芯片层**，在英伟达近乎垄断的高端训练卡之外，增加了推理细分市场的第二供应源，有助于缓解客户对单一供应商的过度依赖。其次，推理芯片的降本会向下传导到**基础设施层**——数据中心可以用更低的电力与制冷开销部署更大的推理算力池，从而压低应用落地的算力成本。最终受益的将是**模型层**与**应用层**，更多中小模型开发者、SaaS公司能以更经济的成本提供实时生成式AI服务。

当然，市场亦需看到现实的挑战。英特尔在数据中心GPU领域尚处于追赶地位，其前代数据中心GPU产品未能动摇英伟达的基本盘。此次“Crescent Island”能否按时量产、生态软件栈是否成熟、客户接纳速度如何，都还是未知数。不过，如果推理朝着“总量巨大、单次任务轻量”的方向持续演进，一条从内存到散热全面压缩硬件成本的路线，极有可能在边缘推理、推荐系统、批量文本处理等场景中抢到一席之地。这将使AI硬件投资的叙事从单纯“谁算力最强”部分转向“谁能让单位推理成本最低”，值得产业观察者持续跟踪。

英特尔拟年底前推新AI芯片：主打推理，内存与风冷更便宜

延伸阅读

相关每日新闻