AI训练四足机器人实现全自主崎岖低摩擦地形行走

打印派   2026-01-17 10:57:24

一款四足机器人通过纯仿真训练,在没有人类设计步态或手动调参的情况下,学会了在湿滑不平坦地形上行走。该系统依赖深度强化学习来适应不可预测的环境变化。

腿式机器人被广泛视为灾害救援、勘探和工业检测的有效工具,但传统控制方法在表面突然变化或地形不稳定时往往难以应对。这些系统依赖精确的物理模型和预定义运动模式,在受控环境外常会失效。

深度强化学习通过让机器人从经验中学习提供了一种替代方案,但训练不稳定及陌生地形表现不佳限制了其实际应用——许多学习型控制器仅在训练环境中表现良好。

渐进式训练框架突破局限
该研究通过引入结构化学习框架应对这些局限:系统采用渐进式课程训练策略,由简入难逐步提升地形复杂度,而非从一开始就将机器人置于复杂环境。四足机器人由此学会了高效行走与自主平衡,并对未接触过的表面表现出强大适应力。

高难度地形训练方案
机器人模型具备12个自由度,采用分层控制结构:10Hz运行的高级神经网络策略生成目标关节运动指令,由100Hz运行的低级比例-微分控制器执行以确保稳定精准的运动。

为感知环境,机器人结合了本体感知与仿真视觉:本体感知输入包括关节角度、速度与身体姿态;外部感知数据来自模拟深度相机,可提供局部地形高度图、坡度估算及摩擦信息。

训练采用近端策略优化算法,其奖励函数平衡了前进速度、稳定性、动作平滑度、低能耗与减少足部打滑等多个目标。这种多目标设置促使机器人形成自然行走模式,而非僵硬低效的运动。

四阶段课程训练体系
四阶段渐进式课程训练至关重要:从平坦地面开始,逐步过渡到斜坡、崎岖地形、低摩擦表面,最后加入传感器噪声的混合环境。这种渐进式训练帮助机器人构建出强健的运动技能。

展现本能的适应性机器人
在Webots模拟器中进行的多地形测试显示,训练后的控制器在保持低能耗和最小打滑率的同时,实现了0.79-0.9米/秒的前进速度。摔倒率从平坦地面的0%到低摩擦地形的12%不等。

该策略在新环境中也展现出良好泛化能力:在Webots和PyBullet模拟器中未重新训练的情况下,分别取得94.6%和91.2%的成功率。

消融研究表明课程学习具有关键作用:未经此训练的模型摔倒率与能耗更高。完整训练框架则将摔倒率降至5%,打滑率控制在4.2%。

涌现的智能行为
机器人在训练中发展出多种涌现行为:在斜坡侧向转移重心、崎岖地面缩短步幅、湿滑表面谨慎踏步等,这些行为均未经过显式编程。

尽管仿真成果显著,研究者指出将系统迁移至实体机器人仍面临挑战:硬件限制、传感器误差和环境不可预测性仍是障碍。未来工作将聚焦通过领域随机化和混合控制系统等技术缩小仿真与现实差距。

这项研究证明适应性腿式运动能力可完全通过仿真训练获得,使自主机器人更接近现实世界部署。


0

11 0

发表评论

登陆后参与评论