谷歌正在训练机器人通过乒乓球与人类互动

谷歌正在训练机器人通过乒乓球与人类互动

昨天,谷歌研究院公布了两个正在研究的乒乓球机器人新项目。谷歌机器人团队训练机器人手臂与其他人进行 300 多次对打,并以“业余选手”的精准度接发球。考虑到有些人打乒乓球的水平很差,这听起来可能并不令人印象深刻,但同样的技术可以用来训练机器人执行其他需要人机密切互动的“动态、高加速度任务”。

乒乓球是一项让机器人学习的有趣任务,因为它具有两个互补的特性:它需要在固定且可预测的环境中进行结构化游戏,同时需要快速而精确的动作。机器人用来做决定的学习算法必须努力工作才能变得优秀,但乒乓球桌的局限性限制了它必须应对的世界。打乒乓球是一项需要双方参与的任务,这确实很有帮助:机器人可以与另一个机器人(或模拟)或真人一起训练。所有这些都使其成为探索人机交互和强化学习技术(机器人从实践中学习)的绝佳设置。

Google 工程师使用同一个机器人设计了两个不同的项目。Iterative-Sim2Real 将于今年晚些时候在 CoRL 上展出,而 GoalsEye 将于下周在 IROS 上展出。Iterative-Sim2Real 是一个训练机器人与人类进行 300 次合作对打的程序,而 GoalsEye 则允许它将发球回击到桌子上的特定目标点,精度堪比业余人类。

Iterative-Sim2Real 试图解决“先有鸡还是先有蛋”的问题,即教机器模仿人类的行为。研究团队解释说,如果你一开始没有一个好的机器人策略(一套机器人规则),那么你就无法收集关于人们如何与机器人互动的高质量数据。但是,如果没有人类行为模型,你就无法制定机器人策略。一种替代解决方案是在现实世界中专门训练机器人。然而,这个过程“通常很慢,成本高昂,并且会带来安全相关的挑战,当涉及到人类时,这些挑战会进一步加剧。”换句话说,这需要很长时间,而且人们可能会被机械臂挥舞乒乓球拍弄伤。

Iterative-Sim2Real 通过使用非常简单的人类行为模型作为起点,然后使用模拟和现实世界中的人类来训练机器人,从而避免了这个问题。每次迭代之后,人类行为模型和机器人策略都会得到改进。使用五名人类受试者,使用 Iterative-Sim2Real 训练的机器人表现优于另一种称为模拟到真实加微调的方法。它以少于五次击球结束的回合明显减少,平均回合长度增加了 9%。

另一方面,GoalsEye 着手解决一组不同的训练问题,并教机器人将球回任意位置,例如“左后角”或“右侧球网上方”。模仿学习(机器人根据人类表现数据制定比赛策略)在高速环境中很难进行。影响人类击打乒乓球的变量太多,这使得机器人几乎不可能跟踪学习所需的一切。强化学习通常适用于这些情况,但速度可能很慢,采样效率低下——尤其是在开始时。(换句话说,需要大量重复才能制定出相当有限的比赛策略。)

GoalsEye 试图使用初始的“小型、结构弱、非目标化数据集”来克服这两组问题,该数据集使机器人能够学习击打乒乓球时发生的基本情况,然后允许它自我练习,教会它精确地将球击到特定点。在经过最初的 2,480 次演示训练后,机器人只有 9% 的时间能够将球击回 30 厘米(约 1 英尺)以内。但在自我练习了约 13,500 次击球后,它的准确率达到 43%。

虽然教机器人玩游戏似乎微不足道,但研究团队认为,用乒乓球解决这类训练问题具有潜在的实际应用价值。Iterative-Sim2Real 允许机器人通过与人类的互动进行学习,而 GoalsEye 则展示了机器人如何从非结构化数据中学习,并在“精确、动态的环境中”自我练习。最坏的情况是:如果谷歌的大目标没有实现,至少他们可以制造一个机器人乒乓球教练。

<<:  精确计时需要时间和激光

>>:  这种适用于太空的太阳能电池板可以像折纸一样折叠

推荐阅读

街机玩家吹雪:刺激的游戏体验和迷人角色的融合

街机玩家吹雪 - 游戏精神的结晶■ 公共媒体卵子■ 原创媒体漫画■ 发布日期2002 年 2 月 2...

海瑞塔·拉克斯被盗细胞改变了医学——她的家人终于得到了赔偿

亨丽埃塔·拉克斯的亲属已与一家生物技术公司达成和解,该公司 70 多年前在她不知情的情况下提取了她的...

维珍银河坠毁事件或将导致私人太空飞行出台新规定

过去十年,私营航天公司在测试和运营其技术方面几乎没有受到任何限制。这一切都要归功于《商业航天发射修正...

Rokushin Gattai Godmars:重新评估传奇机器人动画

《Godmars:六神合体》:横山光辉的史诗级太空战争故事《Godmars》于1982年12月18日...

纽约市尚未做好应对未来灾难性洪水的准备

纽约市的建筑并不能抵御洪水的侵袭。纽约市大部分地区仅靠沙丘、植被或矮墙保护。纽约的洪水区挤满了 40...

炸猪排DJ Agetaro的魅力与名声:音乐与美食融合产生的兴奋

炸猪排 DJ 阿吉太郎 - 炸猪排 DJ 阿吉太郎概述《炸猪排 DJ 上太郎》是一部改编自一飘和小山...

影画电影《杰克与豆茎》的号召力与评价:视觉艺术的巅峰

影子图片电影杰克与豆茎 - 影子图片电影杰克与豆茎■ 公共媒体剧院■ 原创媒体动漫原创■ 发布日期1...

你应该启用谷歌的新自动删除隐私功能

你的手机以及与之相连的应用和服务可以确定你的位置——这是一把双刃剑。你希望 Uber 在你等车时知道...

我不明白我丈夫想说什么:探索动漫的吸引力和复杂性

“我听不懂丈夫在说什么”——一部充满深爱和幽默的动漫《我听不懂老公在说什么》是 2014 年播出的电...

青空拳REGENESIS评论:新传奇的开始

《青空之拳 REGENESIS》:关于命运与北极星之战的新故事■ 公共媒体电视动画系列■ 原创媒体漫...

仅用一台笔记本电脑和一支麦克风举办一场精彩的卡拉 OK 之夜

在家里举办卡拉 OK 派对很容易,但你需要一些准备和设备。你可以花钱购买市场上最好的卡拉 OK 系统...

那颗“外星巨型结构”恒星实际上可能是一颗行星吞噬者

艺术家描绘的尘埃围绕贪婪恒星旋转的概念图 T.Pyle/JPL-Caltech/NASA塔比星可能没...

炎炎烈焰:必看的动漫体验

火力队 - Enen no Showbowtie概述《炎炎消防队》是大久保淳创作的日本漫画,于 20...

旺盛的性欲真的能拯救巨型乌龟免于灭绝吗?

过去几年,迭戈付出了很多努力。今年 1 月,这位百岁老人因“旺盛的性欲”帮助其物种生存而登上头条新闻...

为食用大麻热潮增添风味的美味化学物质

尝试大麻的美国人比以往任何时候都多。2021 年盖洛普民意调查发现,49% 的美国成年人表示他们曾吸...