微软与NVIDIA联手推出Windows端AI代理开发工具

NVIDIA与微软合作推出新工具，支持开发者构建本地运行的AI代理

NVIDIA与微软正在让个人AI代理成为 Windows PC 的原生能力。双方在最新的开发者日上公布了一套端到端工具，使创作者和开发者能够在搭载RTX GPU的Windows设备上构建、优化并运行AI代理，无需依赖云端 API。

这套工具链的核心是将微软的ONNX Runtime、DirectML后端与NVIDIA的CUDA和TensorRT加速深度整合。开发者既可以使用微软的AI Toolkit将来自Hugging Face或Azure的模型转换为针对RTX GPU优化的格式，也可以通过NVIDIA NIM微服务快速部署本地化代理。在量化、剪枝等技术的加持下，即使是130亿参数级别的大模型也能流畅运行在消费级显卡上。目前，包括主流的代码生成、视频编辑、内容总结等代理场景均已得到演示支持。

此前，微软已推出Copilot+PC的概念，而此次与NVIDIA的合作进一步将其具象化为可动手构建的开发生态。微软方面明确表示，相关能力将在未来集成到面向用户的Copilot+PC体验中，意味着最终消费者也会在系统层面直接调用这些高度个性化的AI代理。

对AI产业而言，这标志着模型部署正从“云端单中心”向“云-端混合”加速裂变。在黄仁勋提出的“五层蛋糕”框架中，这一事件同时拨动了芯片层和应用层的齿轮：本地推理将放大对消费级GPU和高性能NPU的持续需求，让RTX 40系列或未来芯片的“边缘算力”叙事更扎实；也催生出大量原生Windows AI应用，可能重复智能手机系统催生APP生态的路径。对微软来说，这是强化Windows在AI时代操作系统的地位；对NVIDIA，则是将数据中心外的每一块RTX显卡变成其软件生态的延伸。开发工具的平民化，正把AI代理从实验室拽进每个人的任务栏。

微软与NVIDIA联手推出Windows端AI代理开发工具

延伸阅读

相关每日新闻