宾汉姆顿大学研发AI导盲机器人,实时语音交互为视障者导航

打印派   2026-04-09 08:55:50

美国宾汉姆顿大学(Binghamton University)的研究人员开发出一款能够与用户对话的导盲机器人系统,可提供实时导航辅助和双向语音交互。该系统利用大语言模型(large language models)引导视障用户到达目的地,并沿途描述周围环境和障碍物。与传统的生物导盲犬不同,这款机器人可以在出发前解释路线,并在行进过程中持续提供实时更新。

该研究建立在团队早期工作的基础之上——早期版本的导盲机器人通过牵引绳的物理拉力来响应指令。最新版本增加了对话能力,使用户能够通过语音命令与系统进行交互。研究人员Shiqi Zhang表示:“在这项工作中,我们展示的导盲机器人在某些方面比生物导盲犬更先进。真正的导盲犬最多只能理解大约20个指令。但对于机器人导盲犬,你只需接入GPT-4并配合语音命令,它就能拥有非常强大的语言能力。”

该系统引入了两项关键功能:路线规划语音化和场景实时语音化。出发前,机器人会列出可能的路线和预估行程时间;导航过程中,它会实时描述环境,帮助用户更好地感知周围情况。Shiqi Zhang指出:“这对视障或盲人群体非常重要,因为在没有视觉的情况下,他们对情境和场景的感知相对有限。”

为测试该系统,研究人员招募了七名法定盲人参与者,让他们在大型室内办公环境中进行导航。机器人首先询问用户想去哪里,然后提供路线选项。一旦路线被选定,机器人会逐步引导用户,提供走廊描述和障碍物警报等语音反馈,直至抵达目的地。

参与者在体验后基于可用性和有效性对系统进行了评估。结果显示,用户更倾向于同时包含“出发前路线解说”和“行进中实时播报”的组合方式。一项模拟研究也支持了这一发现,表明对话式导航能够提升用户的导航信心和控制感。与机器人进行语音交互的能力显著增强了信任度和整体用户体验。

研究人员表示,未来的工作将集中在提高自主性以及将导航范围从室内扩展到更复杂的环境和更长的距离。Shiqi Zhang说:“他们对这项技术和机器人感到非常兴奋。他们问了很多问题。他们真正看到了这项技术的潜力,并希望看到它能够投入使用。”该研究的最终目标是让机器人导盲犬成为日常生活中的实用辅助工具,将行动支持与智能交流融为一体。该研究成果已在AAAI人工智能会议上进行展示。


0

15 0

发表评论

登陆后参与评论