阶跃星辰于6月4日正式开源其Flash基座模型Step 3.7 Flash,迅速在海外开发者社区引发关注。根据Artificial Analysis的评测,该模型在输出速度等多个关键指标上夺得第一,并一度登上OpenRouter Trending榜单的全球第二。
官方数据显示,Step 3.7 Flash的运行速度超过400 tokens/s。然而,更令开发者兴奋的是社区的实际测试结果——在极限条件下,有开发者测出该模型的速度甚至能飙升至6000 tokens/s。这一速度远超许多同类模型,使其在需要快速响应的场景中具备显著优势。
除了速度,成本是另一大亮点。据披露,Step 3.7 Flash完成相同任务的成本仅为Anthropic旗下Claude Opus 4.6的约九分之一,却能实现后者97% 的性能。这种高性价比的定位,使得该模型在企业服务市场迅速找到了“实用、利于规模化落地”的生态位。
这款模型并未追求极致的智能水平,而是另辟蹊径,专注于效率优化。这种策略恰好切中了当前AI Agent从演示走向真实商业场景的核心障碍——运行太慢、成本太高。许多企业发现,当模型面对复杂的多步任务时,推理延迟和累积成本往往让Agent的商业闭环难以实现。Step 3.7 Flash的出现,为这一瓶颈提供了一个可能的解法。
从产业角度看,Step 3.7 Flash的发布是模型层竞争从单纯比拼参数规模转向效率与应用落地的又一例证。它位于黄仁勋提出的“五层蛋糕”中的模型层,但其影响直接传导至应用层。更低的推理成本和更快的响应速度,意味着开发者可以构建更复杂、交互更实时的AI Agent应用,而无需担心成本失控或用户体验下降。这可能会加速AI在客服、自动化流程、代码辅助等领域的渗透。
对于上游的基础设施层和芯片层而言,这类高效模型的普及将推高对推理算力的总需求——更便宜、更快的模型会催生更多应用场景,从而增加调用量。同时,这也对算力效率提出了更高要求,可能促使芯片设计进一步向推理优化倾斜。阶跃星辰选择开源该模型,也有望吸引更多开发者在其生态内进行构建,形成数据飞轮,反哺其模型能力的迭代。