英伟达今天正式推出 Cosmos 3 模型,定位为物理智能领域的开放世界基础模型。这一新模型最引人注目之处在于其**混合 Transformer 架构**,将以往需要分别实现的视觉推理、世界生成与动作预测统一在一个系统内,可接收视频或图像输入,理解场景动态,生成未来可能的环境演变,并直接为机器人、自动驾驶车辆等物理实体规划动作序列。
Cosmos 3 并非英伟达首次涉足物理 AI。早在 2023 年 CES 期间,该公司就曾展示 Cosmos 平台,旨在为机器人和自动驾驶开发者提供高保真的仿真环境。此次发布的 3 代版本进一步强化了“世界模型”的能力,且采用**全面开放**策略,开发者可自由获取、微调并部署,这与英伟达在软件生态上的开源倾向一脉相承。该模型训练数据涵盖大量合成与真实场景,能够模拟多样化的物理交互,从而帮助开发者摆脱对昂贵真机数据采集的过度依赖。
从产业链视角看,Cosmos 3 精准落在黄仁勋“五层蛋糕”的**模型层**。它并非孤立的发布,而是与英伟达已有的 Omniverse 数字孪生平台、Isaac Sim 机器人仿真工具形成闭环:Omniverse 提供可微物理渲染的虚拟世界,Cosmos 3 利用这些环境生成海量训练样本,再驱动各种机器人与自动驾驶模型的训练。这种一体化方案让英伟达在物理 AI 领域建立起软硬件协同的护城河。
对投资者而言,Cosmos 3 的意义不止于技术突破。它进一步巩固了英伟达在物理 AI 开发者生态中的主导地位,让大量初创公司与工业企业更容易上手开发具身智能,从而**锁定对英伟达训练与推理芯片的持续需求**。随着人形机器人赛道升温以及自动驾驶从 L2+ 向 L4 推进,此类世界模型有望成为产业基础设施,带动数据中心 GPU 的用量增长。同时,开源策略也意味着英伟达正在复制 Meta 在语言模型领域的路线——以免费建立标准,最终通过硬件和配套服务变现。当然,模型层竞争也在白热化,OpenAI 等对手同样在布局多模态与具身智能,但英伟达凭借硬件—平台—模型的垂直整合,短期内的优势仍然显著。