NVIDIA与微软正在让个人AI代理成为 Windows PC 的原生能力。双方在最新的开发者日上公布了一套端到端工具,使创作者和开发者能够在搭载RTX GPU的Windows设备上构建、优化并运行AI代理,无需依赖云端 API。

这套工具链的核心是将微软的ONNX Runtime、DirectML后端与NVIDIA的CUDA和TensorRT加速深度整合。开发者既可以使用微软的AI Toolkit将来自Hugging Face或Azure的模型转换为针对RTX GPU优化的格式,也可以通过NVIDIA NIM微服务快速部署本地化代理。在量化、剪枝等技术的加持下,即使是130亿参数级别的大模型也能流畅运行在消费级显卡上。目前,包括主流的代码生成、视频编辑、内容总结等代理场景均已得到演示支持。

此前,微软已推出Copilot+PC的概念,而此次与NVIDIA的合作进一步将其具象化为可动手构建的开发生态。微软方面明确表示,相关能力将在未来集成到面向用户的Copilot+PC体验中,意味着最终消费者也会在系统层面直接调用这些高度个性化的AI代理。

对AI产业而言,这标志着模型部署正从“云端单中心”向“云-端混合”加速裂变。在黄仁勋提出的“五层蛋糕”框架中,这一事件同时拨动了芯片层应用层的齿轮:本地推理将放大对消费级GPU和高性能NPU的持续需求,让RTX 40系列或未来芯片的“边缘算力”叙事更扎实;也催生出大量原生Windows AI应用,可能重复智能手机系统催生APP生态的路径。对微软来说,这是强化Windows在AI时代操作系统的地位;对NVIDIA,则是将数据中心外的每一块RTX显卡变成其软件生态的延伸。开发工具的平民化,正把AI代理从实验室拽进每个人的任务栏。