一家源自复旦大学的具身智能团队近日公布了旗下核心成果——机器人原生**世界动作模型**,并首次对外披露其**时空一体架构**的技术细节。与传统的“感知-规划-控制”解耦路线不同,该模型将世界模型的环境表征与动作生成网络在时空维度上深度耦合,使得机器人可以直接从原始观测生成连续的动作序列,大幅降低了模块间延迟和信息损耗。在同步放出的演示中,机械臂在灵巧抓取、动态避障等任务上展现了令人印象深刻的泛化能力。更受资本关注的是,这家创立不久的公司在产品亮相前的半年内已迅速斩获**五轮融资**,虽然融资金额与投资方暂未公开,但这一密度在近期的具身智能领域相当罕见。
背景层面,通用机器人大脑的竞赛已在国内外白热化展开。谷歌的RT系列、特斯拉的Optimus,以及国内银河通用、星尘智能等均在不同技术路线上寻求突破。世界模型能够模拟物理环境演变,而动作生成决定机器人如何行动,两者的一体化设计一直是学界与业界攻克的难点。复旦系在机器人领域有长期积累,此次成果凸显出高校科研向商业落地的加速趋势。时空一体架构可视为引入视频生成中时空一致性的理念,将时间步进嵌入到动作规划中,兼顾了长序列执行的连贯性与即时反应。
从AI产业的“五层蛋糕”来看,该模型属于典型的**应用层**创新,直接面向工业、服务机器人的端到端操控。但它的技术特性决定了实时推理要求极高,需要边缘端高性能芯片与低延迟基础设施的支持,这为**芯片层**的专用神经处理器和**基础设施层**的近实时计算架构提供了新的驱动力。对投资者而言,密集的融资节奏反映出机构对具身智能赛道估值逻辑的认可,认为通用动作模型可能成为机器人基础模型层的标准组件,如同GPT对语言模型的拉动。然而,赛道内卷加剧、真实场景数据获取成本高以及落地周期偏长亦是必须正视的现实。从更广视角看,若时空一体模型能通过工程化验证,或将催生上游高精度传感器、仿真平台与物理世界数据采集工具的配套需求,形成一个环环相扣的产业共振。