国产大模型公司阶跃星辰近日迎来一项重要技术里程碑。其最新推出的轻量级模型Step 3.7 Flash,在权威模型评测平台Artificial Analysis的榜单上,一举拿下速度、性价比和端到端表现三项核心指标的第一名。这一成绩不仅让Step 3.7 Flash在众多国际主流模型中脱颖而出,也再次验证了国内团队在模型推理效率优化上的工程实力。
根据Artificial Analysis公布的数据,Step 3.7 Flash的生成速度达到每秒超过200个token,远超多数同级别模型。在衡量经济性的性价比维度上,该模型的输入成本为每百万token 0.005美元,输出成本为每百万token 0.01美元,合计成本极低。端到端表现则综合评估了从用户发出请求到完整响应返回的全程时延与质量,Step 3.7 Flash同样位列榜首。相比之下,OpenAI的GPT-4o mini、Anthropic的Claude 3.5 Haiku等轻量级模型在这几项指标上均被拉开差距。
阶跃星辰此前已推出Step系列多款模型,覆盖从千亿参数大模型到轻量级Flash版本。Step 3.7 Flash延续了该系列在数学推理、代码生成和通用对话上的能力,同时通过模型架构优化、量化技术和推理引擎加速,实现了速度与成本的极致平衡。该模型主要面向需要低延迟、高并发的应用场景,如智能客服、实时翻译、代码补全和边缘设备部署。
从产业背景看,模型推理成本一直是AI应用大规模落地的核心瓶颈之一。尽管过去两年大模型能力飞速提升,但高昂的API调用费用和延迟问题仍让许多开发者望而却步。Artificial Analysis榜单自推出以来,已成为衡量模型实际部署价值的重要参考,其性价比和速度排名直接影响开发者的选型决策。此前,这一榜单的领先位置多由海外厂商占据,国产模型此次登顶,反映出国内在模型工程化落地上的快速追赶。
在黄仁勋提出的“五层蛋糕”框架中,Step 3.7 Flash的突破直接作用于模型层,并通过降低推理成本对上层应用形成强力拉动。更便宜的API意味着AI原生应用、Agent、内容生成工具等可以以更低成本服务更多用户,加速商业化闭环。同时,推理效率的提升也间接降低了对底层算力芯片的依赖,使得同等算力资源能支撑更大规模的用户请求,优化基础设施层的整体效率。
不过,也需看到,轻量级模型在复杂推理、长上下文理解和多模态能力上仍与大参数模型存在差距。Step 3.7 Flash的领先更多体现在工程优化层面,而非基础能力的全面超越。未来,随着更多国产模型在性能与效率上持续迭代,全球模型市场的竞争格局或将进一步重塑。对于AI产业投资者而言,模型层性价比的快速提升,意味着应用层的爆发可能比预期更早到来,但同时也可能加剧模型厂商之间的价格竞争,压缩利润空间。