英伟达与微软在 Microsoft Build 大会上公布了一项重磅合作:双方将联手推出面向代理式 AI 的统一开发与部署堆栈,覆盖 Windows 终端设备、Azure 云服务以及本地数据中心。该方案的目标是让开发者能够使用一致的接口和工具链,轻松构建能自主规划、调用工具并执行长时间推理的智能代理应用。
根据合作内容,英伟达将其 NVIDIA NIM 推理微服务、NeMo 等模型优化框架、TensorRT-LLM 以及 cuDNN 等加速库与微软的平台深度整合。在云侧,开发者可通过 Azure AI Foundry 直接调用经英伟达优化的模型,并在虚拟机上获得高效的推理性能;在边缘侧,双方计划在 Windows 操作系统中原生集成英伟达的 AI 运行时,让数亿台 PC 也能稳定运行复杂的代理工作流。同时,针对本地离线场景,也提供了一套从模型部署到安全沙箱的完整解决方案。
这一合作的直接背景是,AI 产业正从以生成内容为主的阶段,迈向需要复杂推理与行动能力的“代理时代”。但代理式 AI 对延迟、安全、上下文管理的要求远高于聊天机器人,单一模型或单个云平台难以单独满足。英伟达在 GPU 和 CUDA 领域近乎独占的硬件生态,加上微软横跨操作系-统、云计算和开发工具的平台优势,两者的结合相当于把算力、软件和部署环境打包成“交钥匙”工程,可大幅降低企业入场门槛。
从产业链视角审视,此次联手同时触动了“五层蛋糕”中的芯片、基础设施、模型和应用四个层级。对英伟达来说,这不仅是向企业推理市场渗透的新通道,还可能催生消费级显卡在本地运行代理 AI 的需求,从而拓宽其 GPU 的销售场景。对微软而言,将代理能力深度嵌入 Windows 和 Azure,有望强化其作为企业级 AI 平台的地位,并与 Copilot 系列产品产生协同。市场观察人士认为,此类合作会加速推理算力的消耗,并可能推动下一波企业 AI 资本开支周期,但实际拉动效应仍取决于代理应用的规模化落地速度与推理成本的优化程度。