英伟达在Computex 2024期间正式推出面向个人电脑的新型处理器RTX Spark,并在随后面向国内市场的沟通中详细解读了其技术架构。RTX Spark是一颗系统级芯片,集成了基于Blackwell架构的RTX GPU与一颗拥有20核心的Grace CPU,两者通过NVIDIA NVLink-C2C芯片互连实现高带宽耦合。其中CPU部分由联发科与英伟达联合设计,采用Arm指令集。GPU内置6144个CUDA核心和支持FP4精度的第五代Tensor Core,整体AI算力达到1 Petaflop,并支持最高128GB的统一内存,从根本上缓解了CPU与GPU之间的数据搬运瓶颈。
在实际负载方面,RTX Spark可在本地流畅运行参数规模达120B、上下文窗口100万token的大语言模型,允许用户在PC上部署复杂的AI代理。创意场景中,它能实时渲染超过90GB的大型3D场景,编辑12K 4:2:2格式视频并生成4K AI视频。游戏表现上,该芯片可驱动1440p分辨率下的3A大作以超过100 FPS的帧率运行。英伟达还为RTX Spark加入了新的安全基元与NVIDIA OpenShell固件,从硬件层面强化了设备安全与可管理性。
这一设计将原本用于数据中心的Grace CPU带入消费PC,联发科的参与则反映出英伟达对Arm PC生态的加速投入。此前双方已在汽车芯片领域合作,此次联手被视为英伟达回应AI PC算力需求的关键一步,意图将强大的本地推理能力普惠至个人用户。
从产业视角看,RTX Spark位于“五层蛋糕”的芯片层,向下带动Arm IP授权与先进封装需求,向上则直接赋能模型层与应用层。本地运行大模型的能力让个人设备可以承担原本依赖云端的智能任务,不仅可能改变PC软件的交互形态,还可能对云端推理的成本结构产生远期影响。同时,英伟达通过联发科的Arm设计经验,在x86主导的PC市场中开辟了Arm路线,与高通骁龙X系列、苹果M系列形成竞争。对于英伟达自身,将CUDA生态从服务器延伸至PC,有助于巩固其在AI开发者社区的粘性,也让其在边缘AI设备上的芯片拼图更加完整。尽管Arm PC尚需在游戏兼容性和外设生态上持续完善,但RTX Spark已为“AI PC”的算力基建提供了一个极具想象力的硬件蓝图。