谷歌DeepMind展示Apollo人形机器人操控未知物体新能力

打印派 2025-12-12 10:01:20

谷歌DeepMind近期展示了其与Apptronik合作开发的Apollo人形机器人掌握的全新技能：该机器人能够熟练操控从未接触过的物体。演示视频中，机器人不仅可处理形状奇特或质地柔软的物体，还能响应"拿起绿色积木"等语音指令，并在物体被移动时实时调整动作。

AI驱动人形机器人迈向通用化

据《福布斯》报道，谷歌DeepMind此次技术突破标志着通用型人形机器人发展迈出重要步伐。通过将先进的Gemini 3与Gemini Robotics AI模型与Apollo人形机器人结合，研究团队致力于创建无需针对新环境重新训练、即可执行多种现实任务的智能系统。Gemini Robotics具备"多载体"控制能力，可操作从双臂工业机器人到Apollo等全尺寸人形机器人的多种设备。

实验室最新演示显示，Apollo已能完成打包午餐、分类衣物、整理物品等日常活动，并可在人类家庭常见的非结构化环境中自主导航。这种进步得益于近两年AI模型与硬件成本的同步提升，但DeepMind指出，当前仍需解决训练数据效率与安全问题——特别是机器人在人类、宠物及易碎物品共存环境中的安全操作挑战。

"内心独白"技术革新机器人学习范式

DeepMind正在开发的"内心独白"技术有望彻底改变机器人学习方式。根据近期披露的专利文件，该系统让AI智能体通过观看人类执行任务的视频或图像，自动生成对观察内容的自然语言描述。例如，机器人观察人类拿起水杯的动作时，会在内部将其描述为"此人拿起水杯"。通过将视觉输入与这种内部语言结合，系统能帮助机器人更清晰地理解动作逻辑，并在遇到类似场景时准确复现。

该方法支持"零样本学习"，使机器人无需预先训练即可处理陌生物体或任务。DeepMind表示，这种技术能显著降低机器人训练所需的内存与算力消耗，较现有方法更具效率。此项研究与该公司此前推出的"Gemini Robotics On-Device"（可在机器人本地运行的精简版基础模型）形成技术协同。专家指出，本地AI与内心独白技术的结合，能为机器人提供关键情境认知，大幅提升其在复杂动态环境中的决策与适应能力。

尽管当前机器人仍难以完成密封保鲜袋等精细操作，但Apollo硬件与DeepMind先进AI的融合已标志着实质性突破。《福布斯》分析认为，若该技术在实验室外验证可靠，或将推动行业向通用机器人 worker 加速迈进——这种机器人不仅能理解指令、实时适应环境，更能在执行物理任务时突破以往诸多限制。