英伟达推出物理AI开源模型 Cosmos 3

英伟达推出Cosmos 3，基于混合Transformer架构集成视觉推理与动作预测

英伟达今天正式推出 Cosmos 3 模型，定位为物理智能领域的开放世界基础模型。这一新模型最引人注目之处在于其**混合 Transformer 架构**，将以往需要分别实现的视觉推理、世界生成与动作预测统一在一个系统内，可接收视频或图像输入，理解场景动态，生成未来可能的环境演变，并直接为机器人、自动驾驶车辆等物理实体规划动作序列。

Cosmos 3 并非英伟达首次涉足物理 AI。早在 2023 年 CES 期间，该公司就曾展示 Cosmos 平台，旨在为机器人和自动驾驶开发者提供高保真的仿真环境。此次发布的 3 代版本进一步强化了“世界模型”的能力，且采用**全面开放**策略，开发者可自由获取、微调并部署，这与英伟达在软件生态上的开源倾向一脉相承。该模型训练数据涵盖大量合成与真实场景，能够模拟多样化的物理交互，从而帮助开发者摆脱对昂贵真机数据采集的过度依赖。

从产业链视角看，Cosmos 3 精准落在黄仁勋“五层蛋糕”的**模型层**。它并非孤立的发布，而是与英伟达已有的 Omniverse 数字孪生平台、Isaac Sim 机器人仿真工具形成闭环：Omniverse 提供可微物理渲染的虚拟世界，Cosmos 3 利用这些环境生成海量训练样本，再驱动各种机器人与自动驾驶模型的训练。这种一体化方案让英伟达在物理 AI 领域建立起软硬件协同的护城河。

对投资者而言，Cosmos 3 的意义不止于技术突破。它进一步巩固了英伟达在物理 AI 开发者生态中的主导地位，让大量初创公司与工业企业更容易上手开发具身智能，从而**锁定对英伟达训练与推理芯片的持续需求**。随着人形机器人赛道升温以及自动驾驶从 L2+ 向 L4 推进，此类世界模型有望成为产业基础设施，带动数据中心 GPU 的用量增长。同时，开源策略也意味着英伟达正在复制 Meta 在语言模型领域的路线——以免费建立标准，最终通过硬件和配套服务变现。当然，模型层竞争也在白热化，OpenAI 等对手同样在布局多模态与具身智能，但英伟达凭借硬件—平台—模型的垂直整合，短期内的优势仍然显著。

英伟达推出物理AI开源模型 Cosmos 3

延伸阅读

相关每日新闻