麻省理工学院的科学家教机器人如何互相破坏

麻省理工学院的科学家教机器人如何互相破坏

机器人能分辨出自己是否遭到了破坏吗?这也许不是你会考虑的问题,但正是这样的探究激发了麻省理工学院开展一些不同寻常的研究。

为此,麻省理工学院的研究人员创建了两个具有社交意识的机器人的模拟,现在可以判断它们是受到破坏还是得到帮助。在本周于伦敦举行的 2021 年机器人学习会议上发表的一篇新论文中,麻省理工学院的一个团队展示了他们如何使用数学框架为一系列机器人代理注入社交技能,以便它们能够以类似人类的方式相互互动。然后,在模拟环境中,机器人可以相互观察,猜测对方想要完成什么任务,然后选择帮助或阻碍他们。实际上,机器人的思维方式与人类一样。

这样的研究听起来可能有点奇怪,但研究机器人之间不同类型的社交情况如何发挥作用可以帮助科学家改善未来的人机互动。此外,这种人工智能社交技能的新模型也可能成为人类社交的测量系统,麻省理工学院的研究小组表示,这可以帮助心理学家研究自闭症或分析抗抑郁药的效果。

社交机器人

麻省理工学院研究科学家、这篇最新论文的作者安德烈·巴布 (Andrei Barbu) 表示,许多计算机科学家认为,让人工智能系统具备社交技能将是让机器人真正在我们的家庭、医院或护理机构等环境中发挥作用并对我们友好的最后障碍。在对人工智能进行改造后,他们可以将这些工具带入认知科学领域,以“真正定量地理解一些一直难以捉摸的东西”,他说。

“出于一些原因,计算机科学或机器人学领域对社交互动的研究并不深入。社交互动很难研究。我们无法给它分配一个明确的数字,”Barbu 说道。“当你与某人互动时,你不会说‘这是 7 号帮助’。”

他说,这与人工智能中常见的问题不同,例如图像中的物体识别,这类问题定义相当明确。即使是决定两个人之间有什么样的互动(这个问题最简单的层次),对机器来说也可能极其困难。

那么,科学家如何才能制造出不仅能完成任务,还能理解完成任务意味着什么的机器人呢?你能让机器人理解你正在玩的游戏,通过观察就能弄清楚游戏规则,并和你一起玩游戏吗?

为了测试可行性,Barbu 和同事们设置了一个简单的二维网格,虚拟机器人代理可以在其中移动以完成不同的任务。屏幕上的代理看起来像卡通机器人手臂,它们被指示将水桶移到树上或花上。

Github 上的 MIT / Social MDP

为了让机器人具备社交能力,研究人员借鉴了心理学的一些技巧,提出了一些基本但不同的社交互动类别,然后将其编码为一系列动作和反应。他们采用了一种现成的机器人模型,称为马尔可夫决策过程 (MDP),这是一个动作和奖励网络,可以帮助机器人系统根据当前的世界状态做出实现目标的决策。为了插入社交元素,研究人员调整了机器人的奖励反馈,使其能够根据另一个机器人的需求修改其想要的内容。

“我们有一个数学理论,它说如果你想进行社交互动,你应该估计其他代理的目标,然后对这些目标应用一些数学函数,”Barbu 说。“我们将社交互动视为彼此奖励的函数。”这意味着机器人 A 必须考虑机器人 B 将要做什么,然后才能采取行动。假设这是人类社交互动的基本机制。

但这类机器人也面临局限性。例如,它们无法识别习惯性社交互动,比如不同国家在礼貌方面的文化传统。这项研究的基本框架是,机器人代理一观察代理二在做什么,然后尝试根据自己的可能目标和周围环境预测代理二的目标。然后,如果代理 A 的奖励设置为代理 B 的目标,它就会帮助代理 B。但是,如果奖励设置为与另一个代理的目标相反,那么它就会阻止另一个代理实现其目标。

研究人员可以添加层次,使社交互动更加复杂。“有一些动作的属性、奖励、其他代理的目标,你需要评估,”Barbu 说。“我们有更复杂的社交互动,比如与另一个代理交换某些东西,你必须弄清楚这个动作对他们来说有多大价值,对我来说有多大价值。”

下一步,该团队将积极致力于在现实世界中使用机器人复制这些模型,并增加交换、强制等互动。

人类能否分辨机器人是否进行社交互动?

为了从人类的角度了解机器人编码社交互动的能力,研究人员为具有不同社交推理水平的机器人生成了 98 种不同的场景。0 级代理只能采取物理动作。它本身不具有社交能力,也不认为其他人具有社交能力。1 级代理具有物理目标并且具有社交能力,但不知道其他代理具有社交能力。它可以帮助、阻碍或窃取其他代理的信息,但如果其他代理试图妨碍它,它不会察觉。2 级代理具有物理和社交目标,并且它认为其他代理是 1 级。因此,它可以避免破坏,认识到需要帮助,并进行协作。

然后,12 名人类受试者观看了 196 个这些机器人互动的视频片段,这些视频片段本质上是一系列计算机动画。观看之后,他们被要求预测机器人的社交程度以及它们的互动是消极的还是积极的。在大多数情况下,人类都能准确识别正在发生的社交互动。

“在认知科学方面,我们也非常感兴趣的是人们如何理解这些类型的社交互动,”巴布说。“人类到底在关注什么?当人类不同意我们的模型时会发生什么?”

[相关:我们是否足够信任机器人,可以让它们来掌管一切?]

Barbu 思考的另一个问题是,该模型是否可以用于分析不同类型的疾病和障碍(如抑郁症、创伤后应激障碍或自闭症)如何影响人们的社交互动或他们对社交互动的看法。

社交机器人到底有什么用呢?

这项研究由美国国防部高级研究计划局和美国空军部分资助,未来可能会为语言习得研究以及语境在语音请求中的重要性提供参考。

“我们彼此使用的语言绝大部分都与与他人的互动有关。因此,多年来,我们一直在研究这个基础问题,”巴布说。基础就是将语言这种抽象的东西与你在世界上看到的实际事物联系起来。

“如果你观察一个人一天中说的绝大部分话,就会发现它们都与其他人想要什么、他们想什么以及他们想从其他人那里得到什么有关,”他说。“如果你想让机器人进入某人的家中,那么了解社交互动就非常重要。”

这是因为在大多数动作识别中,我们通常认为非常具体的词语可能具有不同的社交含义。例如,“拿”水瓶与“拿”孩子是完全不同的互动。虽然命令在技术上是相同的,但社交意识会提醒机器人对待孩子比对待水瓶更温柔。

这是该团队为 DARPA 开展的研究工作,其主要兴趣是儿童语言习得模型,以帮助美国士兵与世界各地不说英语的人进行交流。

“训练语言翻译模型很难。很难生产训练士兵的资源。DARPA 对能够像孩子一样学习语言的机器人感兴趣,因为孩子们学习语言不是通过拥有大量数据语料库或类似的东西,”Barbu 说。“他们通过观察 [人们] 之间的互动、在物理环境中观察这些互动来学习语言。”

他们在研究中达到了想要了解社交语言的阶段,并转向制定社交模型,这些模型稍后将融入他们的语言学习者中。

[相关:Alexa 的重大更新,以及亚马逊对环境 AI 的追求]

他们为麻省理工学院空军人工智能加速器所做的工作具有类似的规模,他们为空军构建语音界面人工智能助手奠定基础,就像亚马逊的 Alexa 一样,可以回答有关武器系统、飞机等数十亿份文件的问题。

巴布说:“在这种情况下,很难找到有关这架飞机、这套武器系统的具体问题的答案。”此外,空军希望社交人工智能助手能够进行双向对话,并提出合理的问题。

<<:  Venmo 和亚马逊合作简化您的结账流程

>>:  碳捕获技术的真相

推荐阅读

乔斯林·贝尔·伯内尔发现了脉冲星,但诺贝尔奖却颁给了别人

科学新闻的年鉴并不总是尽可能地全面。因此, PopSci 正在努力通过《In Hindsight》系...

你可以欺骗你的大脑少用手机

本文已更新。最初于 2018 年 9 月 24 日发布。即使手机处于静音状态,它也在不断引起你的注意...

阅读电子书会比玩电子游戏更让我们快乐吗?答案很复杂。

疫情期间,媒体消费激增。电子书销量上升。2020 年有声读物下载量较 2019 年增长 16%。流媒...

评《后宫鸦》:享受迷人的世界和深刻的故事

“后宫乌鸦”:乌鸦女王的神秘故事及其魅力《后宫鸦》是改编自白河金子的轻小说的电视动画,于2022年1...

无人机如何帮助监测吉尔吉斯斯坦的放射性遗产

在吉尔吉斯斯坦西部的麦卢苏镇上空,国际原子能机构正在使用无人机监测辐射。从 1946 年到 1968...

汤姆·皮里比《大家的歌》1965年版的吸引力与评价

汤姆·皮里比——《大家的歌(1965年版)》的吸引力与评价1965年8月在NHK教育电视台(现NHK...

如何隐藏或自定义 MacBook 的刘海

2017 年,苹果在 iPhone X 上推出刘海屏时就改变了智能手机的屏幕,近年来,该公司一直在其...

《爱的彼岸》的魅力与评价:描绘日常生活中小确幸的治愈系动画

《Aiura》——一部轻松的动画,描绘温馨的日常生活《Ai-Ura》是一部根据 Chama 的同名漫...

加拉帕戈斯群岛鸬鹚是如何忘记飞翔的

鸬鹚外形独特,羽毛呈深色,是捕鱼高手,它们会潜入深海追捕猎物。世界上有 40 种鸬鹚,它们都是游泳高...

五角大楼如何帮助士兵制造廉价无人机

国防创新部门负责将商业技术引入五角大楼,该部门将在未来几周内宣布批准更多美国制造的业余无人机用于军事...

阿拉斯加的这个小镇是艾迪塔罗德狗拉雪橇大赛的重要一站,因为这里的馅饼

这个故事最初刊登在 Saveur 上。在阿拉斯加州库斯科奎姆山脉的阴影下,在一条蜿蜒的河流沿岸的山谷...

整个银河系的恒星都在死亡——为什么我们看不到它们?

1054 年 7 月 4 日,金牛座的一颗恒星爆炸。距离我们约 6,500 光年,几个世纪后被称为...

男子误将女友当成机器人

这是丹佛科学会议的第四天——二月份的四天,会议中心非常繁忙,走廊很长,灯光明亮,严肃的科学家在漆黑的...

《僵尸之地传奇复仇》评论:僵尸的新挑战和感人的故事

僵尸之地传奇复仇 - 僵尸的新挑战《丧尸乐园传奇复仇》于 2021 年 4 月至 6 月播出,是描述...

按一下贪睡按钮有帮助还是有害?

整晚睡眠中断会让你醒来后变得懒散无力。同样,反复按闹钟的贪睡键导致早晨起床起伏不定,也会产生有害影响...