谷歌DeepMind近期展示了其与Apptronik合作开发的Apollo人形机器人掌握的全新技能:该机器人能够熟练操控从未接触过的物体。演示视频中,机器人不仅可处理形状奇特或质地柔软的物体,还能响应"拿起绿色积木"等语音指令,并在物体被移动时实时调整动作。
AI驱动人形机器人迈向通用化
据《福布斯》报道,谷歌DeepMind此次技术突破标志着通用型人形机器人发展迈出重要步伐。通过将先进的Gemini 3与Gemini Robotics AI模型与Apollo人形机器人结合,研究团队致力于创建无需针对新环境重新训练、即可执行多种现实任务的智能系统。Gemini Robotics具备"多载体"控制能力,可操作从双臂工业机器人到Apollo等全尺寸人形机器人的多种设备。
实验室最新演示显示,Apollo已能完成打包午餐、分类衣物、整理物品等日常活动,并可在人类家庭常见的非结构化环境中自主导航。这种进步得益于近两年AI模型与硬件成本的同步提升,但DeepMind指出,当前仍需解决训练数据效率与安全问题——特别是机器人在人类、宠物及易碎物品共存环境中的安全操作挑战。
"内心独白"技术革新机器人学习范式
DeepMind正在开发的"内心独白"技术有望彻底改变机器人学习方式。根据近期披露的专利文件,该系统让AI智能体通过观看人类执行任务的视频或图像,自动生成对观察内容的自然语言描述。例如,机器人观察人类拿起水杯的动作时,会在内部将其描述为"此人拿起水杯"。通过将视觉输入与这种内部语言结合,系统能帮助机器人更清晰地理解动作逻辑,并在遇到类似场景时准确复现。
该方法支持"零样本学习",使机器人无需预先训练即可处理陌生物体或任务。DeepMind表示,这种技术能显著降低机器人训练所需的内存与算力消耗,较现有方法更具效率。此项研究与该公司此前推出的"Gemini Robotics On-Device"(可在机器人本地运行的精简版基础模型)形成技术协同。专家指出,本地AI与内心独白技术的结合,能为机器人提供关键情境认知,大幅提升其在复杂动态环境中的决策与适应能力。
尽管当前机器人仍难以完成密封保鲜袋等精细操作,但Apollo硬件与DeepMind先进AI的融合已标志着实质性突破。《福布斯》分析认为,若该技术在实验室外验证可靠,或将推动行业向通用机器人 worker 加速迈进——这种机器人不仅能理解指令、实时适应环境,更能在执行物理任务时突破以往诸多限制。
53 0
登陆后参与评论
2025-12-12 10:03:39
2025-12-12 09:59:56
2025-12-11 10:23:27
2025-12-11 09:56:26
2025-12-09 11:29:32
2025-12-09 11:16:58
2025-12-09 11:12:35
2025-12-09 11:10:56
2025-12-08 11:02:38
2025-12-08 10:59:40
2025-12-08 10:56:53
2025-12-05 10:38:19