OpenAI首席执行官山姆·奥尔特曼近期承认,AI服务的token消耗成本已成为一个“巨大的问题”。据Tom's Hardware报道,这一表态源于企业客户日益强烈的抱怨——许多公司在采用OpenAI的模型后,发现AI相关支出完全失控,有的甚至在一个季度内就耗尽了原本规划好的全年AI预算。奥尔特曼的回应表明,这家全球最受瞩目的AI公司正面临来自客户端的切实压力,要求其提供更高效、更具性价比的解决方案。
这一问题的核心在于大语言模型的推理成本。每当用户向GPT-4等模型发送一个请求,背后都需要大量算力进行实时计算,这些算力消耗直接转化为token费用。对于偶尔使用的个人用户而言,成本或许尚可接受,但对于将AI深度整合进业务流程的企业来说,持续的API调用会迅速累积出惊人的账单。部分客户发现,预算编制时的估算与实际发生的费用之间存在巨大鸿沟,导致AI项目的投资回报率远低于预期。
OpenAI并非没有意识到这一挑战。公司一直在努力通过模型蒸馏、推理优化和推出更便宜的模型版本来降低成本,例如GPT-4o mini的发布就是为了在保持一定性能的同时大幅降低价格。然而,随着企业使用场景从简单的文本生成扩展到复杂的代理任务、长文档处理和实时数据分析,token消耗量呈指数级增长,单次交互的成本压缩难以抵消用量激增带来的总支出膨胀。
从产业角度看,这一现象揭示了AI商业化进程中的一个核心矛盾:模型能力越强,应用前景越广阔,但若使用成本无法与创造的价值相匹配,大规模部署就会受阻。在黄仁勋提出的“五层蛋糕”框架中,这直接冲击了最上层的“应用”层——如果企业无法从AI应用中获得正向的经济回报,整个产业链从底层的能源、芯片到中间的基础设施和模型层的增长叙事都将受到质疑。
值得注意的是,OpenAI面临的成本压力并非孤例。谷歌、微软、亚马逊等云巨头在推广自家AI服务时,同样需要向客户证明其成本效益。整个行业正在从单纯追求模型性能的“军备竞赛”,转向更务实的“性价比竞赛”。未来,谁能在大幅降低推理成本的同时保持模型能力,谁就能在企业市场占据先机。对于投资者而言,这不仅是OpenAI一家公司的问题,更是衡量整个生成式AI产业能否从技术炒作走向可持续商业变现的关键指标。