DoorMan系统:人形机器人开门效率超越人类操作员

打印派   2025-12-08 10:56:53

英伟达研究人员近日公布了一项名为"DoorMan"的机器人学习新系统,使人形机器人开门效率超越人类操作员。该系统在售价1.6万美元的宇树G1人形机器人上测试,仅使用内置RGB摄像头并完全依赖仿真训练的强化学习,使机器人开门速度比远程操控的人类更快、成功率更高。

实际测试中,机器人完成任务的速度最高比人类专家快31%,且总体成功率更高。研究人员称这标志着"移动操控"领域的进步——这类任务要求机器人同步完成行走、感知、肢体协调与物体操控。

纯仿真训练的像素到动作映射
DoorMan系统采用全新训练方法,其仅依赖视觉的强化学习策略完全在英伟达Isaac Lab仿真环境中训练,随后无需调整直接部署至现实场景。机器人工作时仅接收原始RGB像素数据。当前大多数人形机器人需要深度传感器或动作捕捉标记等专用输入,而这些在不可预测环境中往往不可靠或难以使用。

研究团队解决了两个制约物理任务强化学习的主要难题。其一是探索挑战:从零学习的机器人可能因无法发现正确动作序列而反复失败。为此,研究人员实施了"分段重置"机制:当机器人在仿真中成功抓住门把手时,该状态会被保存,后续训练可直接从此节点开始,使系统能专注练习开门、穿行等后续步骤,无需重复学习接近阶段。

其二是能见度问题:当机器人过于接近门体时,门把手可能移出摄像头视野。为此团队采用"组相对策略优化"的微调方法,引导学习策略采取保持关键特征可见性的行为,使机器人能在执行任务时通过后退或调整头部位置等微调保持把手在视野中。

人形机器人开启"万门挑战"
中国宇树G1机器人正快速成为机器人研究通用平台,已出现在亚马逊前沿AI与机器人团队、加州大学圣迭戈分校、普渡大学等机构的研究中。其广泛采用使研究者能在相同硬件上对比不同项目成果。DoorMan研究中,机器人表现与通过VR系统操控同款G1的人类操作员直接对比。

研究发现人类远程操作者常难以通过VR界面解读铰链力矩,时而过度用力或失去平衡。而仿真训练让自主系统接触了数百万扇不同铰链刚度、阻尼和几何形状的门,使其发展出更平衡、自适应的交互方式。据研究数据,自主系统成功率达83%,人类专家为80%,非专家仅60%。

性能背后的关键因素是仿真数据的多样性。研究人员利用Isaac Lab生成大量随机化环境,对门宽、铰链属性、把手形状和纹理进行广泛变异。通过在这种宽泛分布中学习,现实世界正如研究所述,成为模型训练范围内的另一个实例。

作者将这种方法定位为仿真驱动机器人学习的范例,其优先考虑可扩展性而非人类示范数据。研究摘要中,他们将该系统描述为"首个使用纯RGB感知实现多样化关节移动操控的人形仿真到现实策略",强调该策略完全在仿真中训练并零样本部署于实体机器人。


0

18 0

发表评论

登陆后参与评论