解决起立鼓掌问题:人工智能研究人员是否应该费心构建 TED 机器人?

解决起立鼓掌问题:人工智能研究人员是否应该费心构建 TED 机器人?
TED@Tunis,TED2013 人才搜索活动的一部分。更多信息请访问 talentsearch.ted.com 照片:James Duncan Davidson James Duncan Davidson

毫无疑问,最新的 XPrize 是迄今为止最奇怪的 XPrize。

它被称为TED 人工智能 XPrize,这个名字似乎说明了一切,但又不完全是。正如上周宣布的那样,这项比赛是“现代图灵测试,奖品是第一个在舞台上走上或滚上舞台并发表 TED 演讲的人工智能,演讲如此引人注目,以至于赢得观众的起立鼓掌。”

但实际奖项并未具体说明。所提出的规则只是比赛最终可能的样子,基于公众提交的想法。

然而,这句话的描述以及示例规则,让人对首届人工智能 XPrize 的有效性产生了疑问。机器发表的 TED 演讲与推动人工智能的发展有什么关系呢?

首先,这些示例规则。正如 XPrize 网站所述,“这个概念的元素可能会用到,也可能不会用到”,但细节仍然很有启发性。在提议的场景中,团队将提前获得 100 个讨论主题。其中一个主题将在 TED 会议上被选中(随机或由观众选择),然后人工智能将有 30 分钟的时间来提出 3 分钟的演讲。在 TED 演讲结束后,“观众将用掌声投票,如果合适,还会起立鼓掌。”

以往的 XPrize 竞赛都采用了完全基于经验的获胜条件——率先越过终点线,或者在两周内两次到达亚轨道高度。在这个虚构的例子中,集体分贝水平是否会将巨大的掌声推向礼堂天花板?如果两个机器人在同一次会议上获得起立鼓掌,情况会怎样?组织者会计算每次鼓掌的速度、发出的欢呼声或流下的眼泪吗?

虽然这些问题听起来有些可笑,但模糊的才艺表演机制与比赛的下一个阶段息息相关,而且这个阶段可能更具挑战性。

在观众评分的 TED 演讲结束后,人工智能必须回答《连线》杂志前主编、TED 大会策展人克里斯·安德森提出的两个问题。专家小组将“投票”。这可能是掌声对决的决胜局。或者也许每位专家的掌声都会放大二十倍?

可以这么说,AI XPrize 似乎不是由 AI 研究人员炮制出来的。样本规则表明 XPrize 的规则要宽松得多,更注重娱乐性,这是一种由真实研究支持的营销噱头。

除非研究人员只是假装。“我认为挑战的精神很酷,也很有用,”斯坦福大学认知科学家 Noah Goodman 说。“但就目前的情况来看,它很容易作弊。你可以找一群艺术家和知识分子,为这 100 个主题中的每一个编写一个脚本,然后在知道是哪个主题时播放正确的脚本。然后你就解决了第一部分,而根本不需要使用人工智能。”

问答环节不会那么容易被操纵,但到那时,起立鼓掌可能已经得到批准或被拒绝。这大致相当于为美国小姐加冕,然后问她地缘政治问题。

问答系统的目的在于提供一个独立的图灵测试,无论它最终如何构建,将经典、直接的人工智能研究元素与看似机器人的表演技巧相结合。图灵测试由计算机先驱艾伦·图灵于 1950 年首次提出,要求机器通过欺骗人类评委来证明其智能,通过一系列即兴的回答让他们相信它和他们一样是人类。

然而,图灵测试更像是科学史,而不是科学,这种方法已被绝大多数人工智能研究人员抛弃。每年,各团队都会争夺洛布纳奖,奖金将颁发给最像人类的聊天机器人。而且每年,除了比赛之外,没有人关心。“洛布纳奖很有趣,但在推动科学议程和吸引公众对人工智能的广泛兴趣方面,它完全失败了,”古德曼说。“图灵测试作为一个思想实验发挥了极其宝贵的作用。它不是一个可行的研究目标。”

在图灵测试的所有问题中,最大的问题之一与人类有关。评委经常被幽默搞晕——不是基于新信息的适应性、创造性的幽默,而是预先准备好的笑话,这些笑话会在有策略的间隔内释放,以避免必须设计更相关的回应。事实证明,人类并不是图灵测试的可靠仲裁者。“这次 XPrize 也会有同样的问题。任何看过很多 TED 视频的人都知道,他们的节奏非常引人注目,很容易辨认,风格平淡无奇,”古德曼说。“只要在笑话和特定的风格技巧中编程,就能获得相当多的好评。”

需要说明的是,古德曼对本次 XPrize 的批评并不像我那么严厉——他真的很期待看到组织者会拿出什么成果。赫特福德大学人工智能教授克斯廷·道滕哈恩则不那么热情。道滕哈恩说:“现在和未来机器人的主要挑战在于与世界的互动,而不是性能技巧。”道滕哈恩的工作涉及人工智能、人机互动和社交机器人。

对于 Dautenhahn 来说,人工智能机器人面临的主要挑战在于它们如何与无生命和社会环境互动——例如,如何在房间中穿行,以及如何进行对话。“我在 XPrize 中看不到这些元素,所以我不确定奖项规则涉及哪些有用的技能——在推动现实生活中的人工智能方面有用,”她说。

一旦实现,AI XPrize 完全有可能成为一项更有意义的研究,而不是一个滑稽的噱头。对于 Goodman 来说,这种转变可能很简单,只需迫使 AI 即兴发挥即可——这是人类智能的一个关键特征,也是机器的长期绊脚石。例如,不要介意 100 个主题集(一个需要预先录制的演示的框架)。相反,系统可以在现场随机获得一个主题,允许从互联网上汇编数据,然后进行演示。现在这是不可能的,”Goodman 说。“我可以想象 5 年后它会成为可能。”

我个人认为,AI XPrize 存在的问题比规则更大,尤其是与赞助商的关系。Progressive Automotive XPrize 并没有要求参赛团队制造保险费本来就很低的汽车。AI XPrize 以 TED 为中心,在 TED 场地上举行,其成功或失败将根据之前的 TED 演讲来衡量。不可否认这些会议的影响力以及 TED 机器人将获得的关注。但当你要求计算机科学家解决问题并赢得起立鼓掌时,这更像是狂欢表演而不是严肃的比赛。这是第一次,有可能赢得 XPrize 却不赢得任何人的尊重。

<<:  史上最雄心勃勃的 DNA 构建项目:科学家制造出人工酵母染色体

>>:  以色列学生利用虚假交通拥堵情况恶搞 Waze 应用

推荐阅读

美国宇航局航天器装配大楼内令人眼花缭乱的景象

您正仰望唯一一艘将人类送上火星的宇宙飞船的诞生地。美国宇航局公布了佛罗里达州肯尼迪航天中心航天器装配...

Rizelmaine 第 1 季:因其迷人的角色和独特的故事情节而广受好评

Liselmaine [第 1 季] - Liselmaine - 详细评论和推荐■ 公共媒体电视动...

使用手机通过蚊子的嗡嗡声识别其种类

蚊子的嗡嗡声不仅令人讨厌,而且令人生畏——它预示着你可能会被叮咬。在最好的情况下,这意味着叮咬后会发...

大神松五郎的魅力与欣赏:对动画的深度解读

《大神松五郎》:描写 80 年代后期青春与友情的 OVA 的魅力1989年12月16日发售的OVA《...

微型“进食和排泄机器”善于吸收碳

世界上最小的动物的粪便可能有助于吸收地球大气中的部分温室气体。在实验室中测试一种使用粘土粉尘的新实验...

蟹状星云的电子发射器非常强大,几乎不应该存在

从 20 世纪 60 年代到 21 世纪,斯坦福线性加速器中心 (SLAC) 的物理学家们将电子以他...

你的私人浏览并不像你希望的那样隐身

时不时地打开隐私浏览窗口并不是什么丢人的事情,无论是访问 NSFW 网站,还是在公共电脑上查看电子邮...

“原子弹爆炸场就是我们的游乐场”——从“赤脚将军”那里了解广岛的历史及其对美国的意义

《我们的游乐场是原子弹爆炸圆顶:赤脚将军:从广岛到美国》——战争悲剧与希望的讯息《我们的游乐场曾是原...

问任何问题:吃人肉会让你发胖吗?

英国布莱顿大学人类起源讲师詹姆斯·科尔表示,一具煮熟的尸体可以提供约 81,500 卡路里的食物。但...

2021 年仍有 6.75 亿人无法用电

2015 年,联合国宣布了一系列相互依存的可持续发展目标 (SDG),旨在为“现在和未来的人类和地球...

售价 120 美元的 Soli Audio 枕头让您远离干扰,安然入睡

优质睡眠比以往任何时候都更加重要。无论您是每晚都需要安静的环境才能入睡,还是喜欢听播客,还是睡眠较浅...

探索“BLAME!”的深度:赛博朋克的巅峰及其吸引力

《Blame!》:一款探索未来城市迷宫的赛博朋克杰作概述“责备!”是改编自贰瓶勉同名热门漫画的剧场版...

太空飞行对人体有两种主要而特殊的影响

我们现在可能有几个理由想要逃离地球的麻烦,搭便车前往火星。但太空生活很艰难:辐射、失重、孤立和混乱的...

《西格德里法的军阀》评论:一部拥有美丽空战和深刻故事的杰作动画

西格里法的军阀 - 西格里法的军阀概述《西格德里法的军阀》是一部电视动画,于 2020 年 10 月...

我们真的可以停止使用化石燃料吗?

今年 7 月,当 Dawn Lippert 在家乡檀香山的海滩上冲浪时,一块不听话的冲浪板突然飞起,...