人工智能产业正在经历一场静默但意义深远的消费模式转变。过去两年,企业争先恐后地将生成式AI整合进业务流程,普遍的做法是直接调用市场上能力最强、也最昂贵的大语言模型,例如OpenAI的GPT-4系列或Anthropic的Claude系列。然而,随着AI账单日益膨胀,一种更为精明的策略——“模型路由”开始进入主流视野,并可能重塑整个AI产业链的价值分配。
CNBC的报道揭示了这一趋势的核心逻辑。模型路由,简单来说,就是由一个智能调度层对用户输入的查询进行实时分析,判断其复杂程度,然后将其导向最合适的模型。一个简单的客户服务问题,比如“我的订单什么时候发货?”,可能只需要一个轻量级、成本极低的模型就能完美处理。而一个复杂的代码生成或法律文件分析任务,才会被路由到像Claude或GPT-4这样的顶级模型。这意味着,企业不再为所有任务支付“顶配”价格。
这种转变的直接后果是,企业的AI推理成本有望显著下降。报道中引述的行业观点认为,通过路由,超过80%的日常查询可由较小的开源或专用模型处理,仅将不到20%的高难度任务留给旗舰模型。这相当于将原本全部按米其林三星标准付费的餐食,改为大部分时间吃营养均衡且价格合理的家常菜,只在特殊场合才享用大餐。
对于AI模型的供应商而言,这无疑是一个需要严肃对待的信号,尤其对OpenAI和Anthropic这类以提供最前沿、高定价模型为核心商业模式的初创公司。它们的收入增长高度依赖于客户持续、大规模地使用其最昂贵的模型。如果模型路由成为行业标准,客户对顶级模型的调用量增速可能会显著放缓,即便AI的整体使用量仍在激增。这将对它们的营收增长叙事和估值逻辑构成直接挑战。
从黄仁勋提出的“五层蛋糕”框架来看,这一变化主要发生在应用层和模型层的交界处,但其影响会迅速向上传导。在应用层,企业找到了优化成本、提高AI投资回报率的有效手段,这会加速AI在更广泛商业场景中的落地,从长远看有利于扩大整个市场的蛋糕。但在模型层,竞争格局将变得更加复杂。一方面,顶级闭源模型的提供商需要证明,其高昂的价格对应着不可替代的、解决最困难问题的独特能力,从而在“路由”体系中稳固其作为最终决策者的地位。另一方面,像Google、Meta和Mistral AI等提供多层次、多尺寸模型矩阵的厂商,以及托管着大量开源模型的云平台,可能会成为这一趋势的受益者,因为它们能提供构建路由体系所需的“弹药库”——从廉价小模型到强大前沿模型的全光谱选择。
更深一层看,模型路由的普及还可能对基础设施层的算力需求结构产生影响。如果大量简单任务被分流到可以在更廉价、更低端硬件上高效运行的小模型,那么对最尖端、供应紧张的GPU(如英伟达的H100/H200系列)的增量需求,其增长速度或许会从“疯狂”回归到“强劲”。当然,这并不意味着算力总需求会下降,恰恰相反,更低的推理成本会催生更多全新的应用场景,带来海量的长尾推理需求,但这部分需求将更多地由不同等级的芯片共同满足,而非仅仅依赖金字塔尖的那一小部分。
报道也点出了这一趋势背后的一个关键假设:路由技术本身必须足够智能和可靠,能够准确判断任务难度,避免将复杂问题错误地交给能力不足的小模型,导致用户体验崩溃。目前,包括多家初创公司和云服务商在内的玩家正在积极研发和提供此类路由解决方案,其成熟度将决定这场成本革命推进的速度。
总而言之,模型路由并非一个简单的技术修补,它标志着AI产业正从“不惜代价追求最强性能”的狂热实验阶段,迈向“精打细算、追求商业可持续性”的理性落地阶段。对于投资者而言,这提醒我们需要更细致地审视AI价值链上不同环节的议价能力和增长驱动力。模型厂商的护城河,将不仅在于能否训练出最强的模型,更在于能否构建一个难以被路由策略绕开的、不可或缺的价值生态。