AI搜索引擎公司Perplexity近日公开了一项名为“搜索即代码”的新架构,彻底改变了AI模型与外部数据交互的方式。传统上,AI应用通过调用预设的固定API来获取搜索结果,模型只能被动接收数据。而Perplexity的新方法赋予模型更大的自主权:它在一个受控的沙盒环境中,直接使用Python语言动态编写和执行自己的搜索管道。
这意味着模型不再只是发送一个查询词,而是可以自主决定如何过滤信息、如何对结果进行去重,甚至如何组合多个搜索步骤。这种从“调用工具”到“编写工具”的转变,让搜索过程更贴合当前查询的具体需求。
根据Perplexity公布的数据,这一架构在实际表现上取得了显著突破。在关键的搜索质量基准测试中,该系统超越了OpenAI和Anthropic的同类顶尖模型。更令业界关注的是其成本控制能力:通过让模型在沙盒内自行处理数据清洗和筛选,大幅减少了无效信息的来回传输,最终将令牌消耗成本降低了高达85%。对于依赖大规模搜索调用的AI应用而言,这直接关系到能否实现可持续的商业化运营。
从产业角度看,这一创新精准地踩在了黄仁勋提出的“五层蛋糕”框架中的最上层——应用层,但其影响会向下传导。当前,AI应用面临的核心挑战之一,是推理成本与响应质量之间的平衡。许多基于大语言模型的应用,其运营成本中很大一部分消耗在频繁调用外部工具和筛选冗余信息上。Perplexity的“搜索即代码”思路,本质上是将部分计算逻辑从模型中心转移到可编程的沙盒执行环境中,让模型更像一个调度者而非简单的消费者。
这背后反映出一个更广泛的趋势:AI应用正在从简单的API拼接,走向更复杂的智能体工作流设计。让模型拥有编写代码的能力并非新鲜事,但将其系统性地集成到核心生产管道中,并以此实现数量级的成本优化,是一个重要的工程化里程碑。它暗示着,未来AI产品的竞争力可能不仅取决于底层模型有多强大,更取决于如何精巧地设计模型与工具之间的交互协议。
对于投资者和从业者而言,这一案例提供了观察AI应用层竞争的新视角。如果这种架构被广泛采用,可能会降低对单一、昂贵的大模型API的依赖,转而寻求更灵活、成本更低的模型来驱动搜索管道,从而改变产业链上的价值分配。当然,该技术目前仍处于早期阶段,其在开放域、高并发场景下的稳定性和泛化能力还有待进一步观察。但Perplexity此举无疑为行业探索高性价比的AI服务,提供了一个极具参考价值的方向。