是什么

推理模型(Reasoning Models)是一类在给出最终答案前,会先生成一连串显式「思考」步骤的大语言模型。它们通过在推理阶段投入更多计算、逐步拆解问题,在数学、编程、逻辑等需要多步推导的任务上表现明显更好。这一思路常被概括为「让模型在回答前先思考」,即用推理时的额外计算换取更高的答案质量。

为什么重要

推理模型代表了大模型能力提升的一条新路径:不再只依赖把模型和训练数据做大,也通过在推理阶段投入更多算力来增强表现。这意味着算力消耗的重心从一次性的训练,部分转移到了每次回答都发生的推理环节,从而抬高了对推理算力和能源的长期需求,改变了下层基础设施的负载结构。

与五层蛋糕的关系

推理模型处在「五层蛋糕」的「模型」层。它的「多想一会儿」特性,直接放大了对「基础设施」与「芯片」层推理算力的消耗,使下层需求不再集中于训练。向上,它让「应用」层在复杂任务上获得更可靠的能力,但也意味着每一次调用都要为更多的底层计算与电力埋单。