组合泛化能力初现:Physical Intelligence新模型让机器人仅凭语言指导操作陌生设备

打印派   2026-04-20 08:58:59

美国机器人初创公司Physical Intelligence近日宣布,其最新AI模型π0.7能够引导机器人执行从未接受过训练的任务。该系统被视为迈向通用机器人“大脑”的早期一步,使机器人能够通过自然语言指导来处理不熟悉的任务。

据这家总部位于旧金山的公司称,实验结果出乎预期。如果得到验证,将表明机器人AI可能正接近一个转折点,其能力提升速度超出预期。该公司在博客中写道:“在我们的实验中,我们看到π0.7展现出组合泛化的初步迹象,将来自不同任务的技能重新组合以解决新问题,例如使用新的厨房电器,甚至让一台没有折叠衣物数据的机器人完成叠衣服。”

π0.7被描述为迈向通用机器人大脑的早期但有意义的一步。研究人员称,它在泛化能力上取得了明显进步,在广泛的灵巧任务上表现出与专用系统相当的水平,同时还能执行训练数据中未包含的任务。实验显示出组合泛化的早期迹象,即模型重新组合已学技能来解决新问题。这标志着机器人训练从传统的为每个任务收集数据、构建独立模型的方式发生转变。

与早期的视觉-语言-行动系统不同,π0.7无需额外微调即可将现有能力应用于新环境。它还能在不同机器人、环境和任务之间实现更有效的泛化。这些结果预示着从特定任务训练向更灵活、通用系统的转变,当模型学会跨领域重用和重组知识时,能力扩展将更高效。

π0.7的广泛泛化能力源于其训练和提示方式。该模型不依赖单一数据源,而是基于多种输入构建,包括多个机器人平台、人类演示以及自主采集的数据片段。系统通过丰富的多模态提示进行训练,这些提示不仅定义了任务,还定义了执行细节——包括文本指令、指定物体排列的视觉子目标以及任务时长等参数。这种额外的上下文帮助模型解读不同的行为和策略,使其能够更灵活地应用知识。

在推理阶段,模型可以遵循标准语言指令,同时融入诸如期望策略或生成视觉目标等指导。这使其能够实时适应,无需重新训练即可提升性能。在测试中,系统展示了通过将有限的先前示例与更广泛的学习知识相结合来推断如何使用陌生物体的能力。在最小指导条件下,它尝试了新任务;而在结构化的逐步指令下,性能显著提升。

该方法突显了向交互式学习的转变——人类反馈和提示设计对结果起着关键作用。不过,系统在执行多步骤任务时仍需详细指导,无法仅凭一条命令自主完成复杂指令。研究人员也指出,目前缺乏标准化基准测试,独立验证较为困难。这些发现仍处于早期阶段,但它们指向了更具适应性的机器人系统——能够在原始训练范围之外扩展能力。


0

22 0

发表评论

登陆后参与评论