麻省理工学院的科学家教机器人如何互相破坏

麻省理工学院的科学家教机器人如何互相破坏

机器人能分辨出自己是否遭到了破坏吗?这也许不是你会考虑的问题,但正是这样的探究激发了麻省理工学院开展一些不同寻常的研究。

为此,麻省理工学院的研究人员创建了两个具有社交意识的机器人的模拟,现在可以判断它们是受到破坏还是得到帮助。在本周于伦敦举行的 2021 年机器人学习会议上发表的一篇新论文中,麻省理工学院的一个团队展示了他们如何使用数学框架为一系列机器人代理注入社交技能,以便它们能够以类似人类的方式相互互动。然后,在模拟环境中,机器人可以相互观察,猜测对方想要完成什么任务,然后选择帮助或阻碍他们。实际上,机器人的思维方式与人类一样。

这样的研究听起来可能有点奇怪,但研究机器人之间不同类型的社交情况如何发挥作用可以帮助科学家改善未来的人机互动。此外,这种人工智能社交技能的新模型也可能成为人类社交的测量系统,麻省理工学院的研究小组表示,这可以帮助心理学家研究自闭症或分析抗抑郁药的效果。

社交机器人

麻省理工学院研究科学家、这篇最新论文的作者安德烈·巴布 (Andrei Barbu) 表示,许多计算机科学家认为,让人工智能系统具备社交技能将是让机器人真正在我们的家庭、医院或护理机构等环境中发挥作用并对我们友好的最后障碍。在对人工智能进行改造后,他们可以将这些工具带入认知科学领域,以“真正定量地理解一些一直难以捉摸的东西”,他说。

“出于一些原因,计算机科学或机器人学领域对社交互动的研究并不深入。社交互动很难研究。我们无法给它分配一个明确的数字,”Barbu 说道。“当你与某人互动时,你不会说‘这是 7 号帮助’。”

他说,这与人工智能中常见的问题不同,例如图像中的物体识别,这类问题定义相当明确。即使是决定两个人之间有什么样的互动(这个问题最简单的层次),对机器来说也可能极其困难。

那么,科学家如何才能制造出不仅能完成任务,还能理解完成任务意味着什么的机器人呢?你能让机器人理解你正在玩的游戏,通过观察就能弄清楚游戏规则,并和你一起玩游戏吗?

为了测试可行性,Barbu 和同事们设置了一个简单的二维网格,虚拟机器人代理可以在其中移动以完成不同的任务。屏幕上的代理看起来像卡通机器人手臂,它们被指示将水桶移到树上或花上。

Github 上的 MIT / Social MDP

为了让机器人具备社交能力,研究人员借鉴了心理学的一些技巧,提出了一些基本但不同的社交互动类别,然后将其编码为一系列动作和反应。他们采用了一种现成的机器人模型,称为马尔可夫决策过程 (MDP),这是一个动作和奖励网络,可以帮助机器人系统根据当前的世界状态做出实现目标的决策。为了插入社交元素,研究人员调整了机器人的奖励反馈,使其能够根据另一个机器人的需求修改其想要的内容。

“我们有一个数学理论,它说如果你想进行社交互动,你应该估计其他代理的目标,然后对这些目标应用一些数学函数,”Barbu 说。“我们将社交互动视为彼此奖励的函数。”这意味着机器人 A 必须考虑机器人 B 将要做什么,然后才能采取行动。假设这是人类社交互动的基本机制。

但这类机器人也面临局限性。例如,它们无法识别习惯性社交互动,比如不同国家在礼貌方面的文化传统。这项研究的基本框架是,机器人代理一观察代理二在做什么,然后尝试根据自己的可能目标和周围环境预测代理二的目标。然后,如果代理 A 的奖励设置为代理 B 的目标,它就会帮助代理 B。但是,如果奖励设置为与另一个代理的目标相反,那么它就会阻止另一个代理实现其目标。

研究人员可以添加层次,使社交互动更加复杂。“有一些动作的属性、奖励、其他代理的目标,你需要评估,”Barbu 说。“我们有更复杂的社交互动,比如与另一个代理交换某些东西,你必须弄清楚这个动作对他们来说有多大价值,对我来说有多大价值。”

下一步,该团队将积极致力于在现实世界中使用机器人复制这些模型,并增加交换、强制等互动。

人类能否分辨机器人是否进行社交互动?

为了从人类的角度了解机器人编码社交互动的能力,研究人员为具有不同社交推理水平的机器人生成了 98 种不同的场景。0 级代理只能采取物理动作。它本身不具有社交能力,也不认为其他人具有社交能力。1 级代理具有物理目标并且具有社交能力,但不知道其他代理具有社交能力。它可以帮助、阻碍或窃取其他代理的信息,但如果其他代理试图妨碍它,它不会察觉。2 级代理具有物理和社交目标,并且它认为其他代理是 1 级。因此,它可以避免破坏,认识到需要帮助,并进行协作。

然后,12 名人类受试者观看了 196 个这些机器人互动的视频片段,这些视频片段本质上是一系列计算机动画。观看之后,他们被要求预测机器人的社交程度以及它们的互动是消极的还是积极的。在大多数情况下,人类都能准确识别正在发生的社交互动。

“在认知科学方面,我们也非常感兴趣的是人们如何理解这些类型的社交互动,”巴布说。“人类到底在关注什么?当人类不同意我们的模型时会发生什么?”

[相关:我们是否足够信任机器人,可以让它们来掌管一切?]

Barbu 思考的另一个问题是,该模型是否可以用于分析不同类型的疾病和障碍(如抑郁症、创伤后应激障碍或自闭症)如何影响人们的社交互动或他们对社交互动的看法。

社交机器人到底有什么用呢?

这项研究由美国国防部高级研究计划局和美国空军部分资助,未来可能会为语言习得研究以及语境在语音请求中的重要性提供参考。

“我们彼此使用的语言绝大部分都与与他人的互动有关。因此,多年来,我们一直在研究这个基础问题,”巴布说。基础就是将语言这种抽象的东西与你在世界上看到的实际事物联系起来。

“如果你观察一个人一天中说的绝大部分话,就会发现它们都与其他人想要什么、他们想什么以及他们想从其他人那里得到什么有关,”他说。“如果你想让机器人进入某人的家中,那么了解社交互动就非常重要。”

这是因为在大多数动作识别中,我们通常认为非常具体的词语可能具有不同的社交含义。例如,“拿”水瓶与“拿”孩子是完全不同的互动。虽然命令在技术上是相同的,但社交意识会提醒机器人对待孩子比对待水瓶更温柔。

这是该团队为 DARPA 开展的研究工作,其主要兴趣是儿童语言习得模型,以帮助美国士兵与世界各地不说英语的人进行交流。

“训练语言翻译模型很难。很难生产训练士兵的资源。DARPA 对能够像孩子一样学习语言的机器人感兴趣,因为孩子们学习语言不是通过拥有大量数据语料库或类似的东西,”Barbu 说。“他们通过观察 [人们] 之间的互动、在物理环境中观察这些互动来学习语言。”

他们在研究中达到了想要了解社交语言的阶段,并转向制定社交模型,这些模型稍后将融入他们的语言学习者中。

[相关:Alexa 的重大更新,以及亚马逊对环境 AI 的追求]

他们为麻省理工学院空军人工智能加速器所做的工作具有类似的规模,他们为空军构建语音界面人工智能助手奠定基础,就像亚马逊的 Alexa 一样,可以回答有关武器系统、飞机等数十亿份文件的问题。

巴布说:“在这种情况下,很难找到有关这架飞机、这套武器系统的具体问题的答案。”此外,空军希望社交人工智能助手能够进行双向对话,并提出合理的问题。

<<:  Venmo 和亚马逊合作简化您的结账流程

>>:  碳捕获技术的真相

推荐阅读

《黄鼠狼之歌》评论:动人的故事与优美的音乐的融合

《黄鼠狼之歌》:一个跨越时空的动人故事1984年6月10日上映的动画电影《黄鼠狼之歌》是一部以美丽的...

乐高积木可能是现场检测神经毒气的关键

乐高积木毁掉了世界各地父母的双脚,但正如德克萨斯大学奥斯汀分校的一项新研究表明的那样,这些可变的儿童...

《迈克尔是什么?》[2] 点评:猫的幽默和日常魅力

“迈克尔是什么?” “OVA的吸引力和详细的评论“迈克尔是什么?” ”是一部根据小林诚人气漫画改编的...

引力和良好的时机帮助哈勃望远镜发现了一颗来自早期宇宙的恒星

当我们回望宇宙深处时,即使是行星、恒星和星系等巨大的物体也会显得很小。放大镜可以提供帮助,但在哪里可...

他让数千只昆虫咬伤和蜇伤他——这就是他学到的东西

你可能不喜欢脚趾被刺的痛苦,但疼痛也是一种恩赐。刺痛教会我们以后避免类似的麻烦,但昆虫学家贾斯汀·施...

在手机上轻松将 PDF 转换为图像

您可能不经常想在手机上将 PDF 转换为 JPG,但这种需求总是在最不方便的时候出现。例如,当您的医...

一套便宜的 LED 是升级你的新电视的最佳方式

每年这个时候,人们都会买很多电视。2016 年,塔吉特在黑色星期五促销期间每分钟售出超过 3,200...

Twitter 正在关闭其糟糕的 Mac 应用程序。以下是替代它的选项。

[更新时间:2018/3/19:它死了。安息吧,老朋友。]自从 2011 年购买第一台 MacBo...

美国海岸警卫队在上一次 OceanGate Titan 打捞任务中发现了什么

美国海岸警卫队官员周二证实,打捞行动成功打捞了 OceanGate Titan 潜水器的剩余残骸。这...

亚马逊日食后促销,购买 Celestron x PopSci 望远镜可节省高达 101 美元

10 月 14 日的日食让我们度过了一段美好的时光,但下一次在美国可见的日食要到 2024 年 4 ...

朱诺:对有吸引力的角色和深刻的故事的评论和推荐

动画电影《朱诺》全面评论与推荐介绍动画电影《朱诺德》于2010年5月11日上映,改编自马塞尔·朱诺德...

看看去年的一些最佳特写摄影作品

总有理由停下来欣赏生活中的点滴。自 2018 年以来,特蕾西和丹·考尔德通过年度特写摄影师大赛吸引人...

最佳相机测试:尼康 D3s,低光之王

无可否认,我喜欢尼康的大多数产品。我不是那种从头到脚穿着尼康服装到处走动、谴责任何敢于使用佳能相机的...

这款奇怪又可爱的新路由器会让你“眼花缭乱”

路由器通常是家用电器中被忽视的、丑陋的继子——但它也是最重要的产品之一。这也许就是为什么近年来我们看...

3D 打印火箭发动机如何助美国重夺太空竞赛

20 世纪 60 年代中期,位于阿拉巴马州亨茨维尔郊外的美国宇航局马歇尔航天中心是火箭工程活动的中...