微软 Build 2026 发布七款自研 AI 模型，图像生成领先谷歌

微软在Build 2026推出首个推理模型及新调优方法，图像生成能力超越谷歌。

微软在年度开发者大会 Build 2026 上宣布了一系列 AI 模型与工具更新，核心是七款全新内部自研模型。这是微软近年来在模型层最大规模的自研成果发布，其中最引人注目的是其首款推理模型。该模型专注于逐步逻辑推导与复杂问题解决，直接对标 OpenAI 的 o 系列与谷歌的 Gemini 推理能力。微软高管在演讲中坦言，公司在推理模型领域仍处于追赶状态，但强调自研推理模型将与 Azure 云服务及 Copilot 产品线深度整合。

在图像生成方面，微软则展现出更强信心。公司发布了新的图像生成模型，并在内部基准测试中声称其性能已超越谷歌的 Imagen 系列。该模型将集成到 Designer、Bing 及 Azure AI 服务中。此外，微软还推出了一种新的模型调优方法，据称能大幅降低企业客户微调大模型的成本与时间。另一个亮点是自主后台代理，这是一种能在后台持续运行、自动处理多步骤任务的 AI 代理，例如自动整理邮件、生成周报或监控供应链异常。

这七款模型覆盖了从轻量级到大规模的不同参数规格，显示出微软正试图构建一个完整的自研模型矩阵。此前，微软主要依赖对 OpenAI 的投资与技术授权，将 GPT 系列模型深度嵌入其产品。但近一年来，微软明显加大了自研投入，包括组建新的 AI 研究团队、开发小型语言模型 Phi 系列等。此次 Build 大会的发布，是这一战略转向的集中体现。

从产业角度看，微软的动作牵动了「五层蛋糕」中的模型层与基础设施层。自研模型意味着微软对上游算力芯片的需求可能进一步定制化，影响英伟达 GPU 及未来自研芯片的采购组合。同时，在应用层，微软将自研模型与 Copilot、Azure、Office 等产品绑定，可能改变企业客户对模型供应商的选择逻辑。对于投资者而言，微软在模型层的自研进展，既是对 OpenAI 依赖风险的对冲，也可能加剧与谷歌、亚马逊等云厂商在 AI 全栈能力上的竞争。推理模型的追赶态势，则反映出当前 AI 竞争已从单纯的参数规模转向逻辑能力与代理行为的落地。

微软 Build 2026 发布七款自研 AI 模型，图像生成领先谷歌

延伸阅读

相关每日新闻