信誉比较好赌钱软件
2022年7月22日

机器人通过观察人类来学习做家务

CMU研究人员开发的新方法使机器人能够在野外学习

由亚伦Aupperlee

亚伦Aupperlee
  • 计算机科学学院

机器人看着 Shikhar巴尔 打开冰箱门. 它记录了他的一举一动, 门的摆动, 冰箱的位置等, 分析这些数据,并准备模仿巴尔所做的.

一开始失败了, 有时完全没有把手, 抓错了地方或者拉错了. 但经过几个小时的练习,机器人成功地打开了门.

“模仿是一种很好的学习方式,”巴尔说.D. 学生 机器人研究所 (RI)在信誉比较好赌钱软件 计算机科学学院. “让机器人直接通过观察人类来学习仍然是该领域尚未解决的问题, 但这项工作在实现这种能力方面迈出了重要的一步."

巴尔一起工作 迪帕克·帕沙克 而且 阿古普塔,两人都是国际研究院的教员,开发了一种新的机器人学习方法,叫做 旋转,短 在野生仿人机器人学习中. 旋转是一种高效的一次性视觉模仿算法. 它可以直接从人类互动视频中学习,并将这些信息推广到新的任务中, 让机器人非常适合学习做家务. 与旋转, 机器人可以观察人们在家执行的各种任务,并收集所需的视频数据,最终决定如何自己完成任务.

该团队为现成的机器人添加了一个摄像头和他们的软件, 它还学会了如何打开和关闭电器,完成20多项任务, 柜门和抽屉, 到给锅盖上盖子, 推一把椅子,甚至从垃圾桶里拿出一个垃圾袋. 每一次, 机器人观看了一次人类完成任务,然后开始练习和学习自己完成任务. 这个团队在本月的 机器人:科学与系统 纽约会议.

帕塔克说:“这项工作提供了一种将机器人带入家庭的方法。. “而不是等待机器人经过编程或训练,成功完成不同的任务,然后再将它们部署到人们的家中, 这项技术使我们能够部署机器人,并让它们学习如何完成任务, 他们一直在适应环境,并通过观察来提高自己."

目前教机器人完成任务的方法通常依赖于模仿或强化学习. 在模仿学习中,人类手动操作机器人,教它如何完成任务. 在机器人学习之前,这个过程对于一个任务必须进行多次. 在强化学习, 机器人通常会接受数百万个模拟例子的训练,然后要求其将训练结果适应现实世界.

这两种学习模型在结构化环境中教机器人完成单一任务时都很有效, 但是它们很难扩展和部署. 旋转可以从任何人类完成任务的视频中学习. 它很容易扩展, 不局限于一个特定的任务,可以在现实的家庭环境中操作. 该团队甚至正在研究一种通过观看YouTube和Flickr上的人类互动视频来训练的旋转版本.

计算机视觉的进步使这项工作成为可能. 利用互联网数据训练的模型,计算机现在可以理解并模拟3D运动. 该团队使用这些模型来理解人体运动,促进了旋转的训练. 

有了旋转,机器人可以在自然环境中完成任务. 的电器, 门, 抽屉, 盖子, 椅子和垃圾袋没有被修改或操作以适应机器人. 机器人对一项任务的最初几次尝试都以失败告终, 但一旦它取得了一些成功, 它很快就掌握了如何完成它并掌握了它. 虽然机器人可能不会用和人类一样的动作来完成任务,但这不是目标. 人类和机器人有不同的部位,移动方式也不同. 重要的是最终的结果是一样的. 门开了. 开关关闭了. 水龙头开着.

“在野外测量机器人, 要求数据可靠、稳定, 机器人应该通过自己的练习在他们的环境中变得更好,”帕沙克说.

-相关内容-