在热身赛中,Jeopardy All-Stars 败给了 IBM 的超级计算机 Watson

在热身赛中,Jeopardy All-Stars 败给了 IBM 的超级计算机 Watson

今天,在位于纽约约克镇的 IBM 总部上演了一场历史性的战斗。两位超级明星《危险边缘!》的校友(肯·詹宁斯和布拉德·鲁特)在美国最具挑战性的智力竞赛预演中与 IBM 的超级计算机沃森对决,我们亲眼目睹了这场惊心动魄的人机大战。

Watson 以 IBM 创始人的名字命名,是一台史诗级的超级计算机。为了完成Jeopardy!比赛的艰巨任务,IBM 花费数年时间打造了一台拥有 2,800 个 Power7 核心的计算机。这种能力是绝对必要的——与许多现代计算机一样,单核 CPU 需要大约两个小时才能回答标准的Jeopardy!问题,而不是 Watson 目前宣称的三秒平均时间。

开发能够回答Jeopardy!问题的算法的一大挑战在于问题本身——这些问题中使用的语言几乎从来都不是简单的,通常包含文字游戏、谜语和讽刺——但增加风险还会带来额外的问题。在一瞬间,参赛者必须评估对问题的信心,权衡这种信心与答错的惩罚,并根据这些因素决定这个问题是否值得回答。对于人类来说,这是一种直觉,但 Watson 必须经过编程,具备一些极其复杂的推理能力,才能做到同样的事情。

Watson 具有一定的自我意识;它知道自己不可能每次都答对,因此在回答之前必须达到一定的信心水平。Watson 的徽标会改变颜色以表明其信心:如果 Watson 有信心,其“头像”上的线条会发出蓝光,否则会发出橙色。

语言的变化无常意味着问题可以用各种不同的方式来解释,因此,弄清楚问题想要问什么就为 Watson 带来了大部分的挑战。为此,计算机实际上会提出数千种不同的可能答案,并根据正确性对它们进行排序。当我们观看快速匹配时,屏幕上会显示前三个答案以及置信度百分比,排名第二和第三的答案通常完全错误。Watson 不太可能混淆一本儿童读物的作者和另一本儿童读物的作者。更可能的是,Watson 会完全误读问题的内容,并得出“什么是儿童?”这样的答案。

在这场介绍性的对决中,我们了解到了节目为了适应比平时更加​​机械化的生物而做出的一些调整。问题直接输入到 Watson 中,因此它不必像人类选手那样“阅读”问题。但 Watson 确实需要按下一个物理按钮才能接听,就像 Ken Jennings 和 Brad Rutter 一样,这几乎消除了计算机的瞬间优势。

有趣的是,Watson 不会连接到互联网,因此不会有任何即时的 Wikipedia 查询。(IBM 的理由是:“Ken [Jennings] 和 Brad [Rutter] 没有连接到互联网,所以 Watson 也不应该连接到互联网。”)那么这个人工智能大脑从哪里获取信息呢?IBM 的工程师在没有互联网的情况下,必须手动加载 Watson 的所有信息,其中包括百科全书、同义词库、字典、书籍、剧本和其他人类知识汇编。

在最终的游戏中,将不会有音频或视频线索,但需要下注的问题(Daily Double 和 Final Jeopardy)将保留。Watson 会针对这些类型的问题给出的类别进行风险分析,但他的精确推理意味着他的赌注通常都是不寻常的数字(人类可能会本能地下注 2,000 美元,但 Watson 的风险评估可能表明下注 1,986 美元更为谨慎)。Watson 实际上会实时学习类别内的内容——如果它不能立即理解某个类别,它会等到该类别中的一两个问题被问到后,再使用这些数据找出模式。Watson 还会考虑竞争对手:如果它正在输,它可能会调整回答它不太有信心的问题,而不是像它处于领先地位时那样。

我与 IBM Watson DeepQA 技术首席研究员 David Ferrucci 就 Watson 面临的困难进行了交谈。“对 Watson 来说,最困难的事情是那些从未被记录下来的事情,”他说。“那些可能留在人们脑海中并能解答琐碎问题的琐事,对于像 Watson 这样的人工智能程序来说,即使它拥有庞大的记忆库,也几乎无法理解。

人类语言的某些元素也非常棘手——那些看似最难理解的东西(比如双关语和文字游戏)可以通过类别名称中的“触发”词来理解,比如“听起来像”。但同义词往往是一个更大的问题。在答案“这种液体可以保护大脑免受伤害”中,沃森必须确定“液体”在这种情况下可以与“流体”互换,“缓冲”可以与“周围”互换。人类本能地知道这个问题在问什么,但沃森必须从各个角度进行分析。

在我观看的预演比赛中,沃森的表现令人吃惊,比赛进行得非常快。沃森不仅表现优异,还以 4,400 美元的成绩轻松获胜,而肯·詹宁斯和布拉德·鲁特分别获得 3,400 美元和 1,200 美元。无论是人类还是机器,参赛者都没有答错问题,但沃森似乎回答得最快。沃森最弱的类别是“儿童图书标题”;肯·詹宁斯几乎包揽了这一类别,布拉德·鲁特后来打趣说:“沃森和我都没有孩子。”

最终的比赛将采用为期两天的锦标赛形式,两天后奖金最多的选手将成为冠军。冠军将获得 100 万美元奖金,亚军获得 30 万美元奖金,季军获得 20 万美元奖金。IBM 将把沃森的全部奖金捐赠给慈善机构,而肯·詹宁斯和布拉德·鲁特将捐出一半奖金。

面对如此巨大的奖金,谁将胜出?贪婪的人类会不会让人类竞争对手变得更加狡猾,从而让沃森占据优势?在特雷贝克傲慢的采访环节中,沃森会讲出什么趣事?(特雷贝克说他“可能会试着跟他开个小玩笑。”)我们要等到 2 月 14 日才能知道答案。

<<:  终结者场景:我们是否赋予了军用机器过多的功率?

>>:  工程师如何制造像大脑一样工作的计算机

推荐阅读

《三丁目之塔玛》评论:体验寻找桃子的感动与刺激!

三街的塔玛:拜托了!找到Momo-chan!! - 电影评论和详情概述电影《三丁目上的玉!快去找桃子...

大型电影制片厂的人工智能交易对好莱坞的未来意味着什么

去年,好莱坞演员走上街头举行了为期 118 天的罢工,许多人举着标语,上面写着“拒绝数字克隆”、“人...

人类何时才能最终切断电源线?

在移动时代,我们基本上不受电线的束缚,这在很大程度上要归功于 Wi-Fi、蜂窝网络以及笔记本电脑、智...

加州亿万富翁的乌托邦可能并不像宣传的那样环保

硅谷的亿万富翁们仍在积极推进他们的计划,即在旧金山附近他们所谓的“非优质农田”上打造一个乌托邦式的、...

宇宙巡逻队 Hopper 评论:宇宙守护者的冒险和情感

宇宙巡弋者 - 宇宙巡弋者■ 公共媒体电视动画系列■ 原创媒体动漫原创■ 播出时间1965 年 2 ...

借助这些 Prime Day 优惠,购买 Apple、Samsung、HP、MSI 等品牌的电脑可享受高达 40% 的折扣

如果您一直在考虑升级硬件,那么您很幸运:亚马逊的 10 月 Prime Day 是购买全新笔记本电脑...

死海中发现奇怪的新细菌生命形式

在死海深处,人们发现了新的生命。由于新发现的淡水泉,某些细菌得以繁衍生息,与其他已知的淡水和咸水细菌...

见见维基百科上为飓风桑迪代言的气候变化否认者

“我只是一个贡献者。我没有头衔,我只是一个普通人,”肯·曼佩尔说,他现年 56 岁,目前失业,住在佛...

全面回顾筋肉人Ⅱ的肌肉胡萝卜之战!超人战争的魅力究竟在哪里?

筋肉人Ⅱ 肌肉胡萝卜大战!超人战争 - 电影评论和详情影片概述《筋肉人Ⅱ:肌肉胡萝卜争夺战!超人大战...

如何申请 NASA 的下一个火星栖息地模拟

想从日常生活中改变一下节奏吗?地球上的生活现在感觉有点让人难以忍受?和三个陌生人一起在 3D 打印的...

工作场所自动化对收入不平等的影响可能比我们想象的还要大

随着各大公司不断宣布劳动力链自动化程度不断提高,许多人类员工自然而然地担心自己的工作不会因即将推出的...

发明洗碗机的女人被遗忘的故事

1893 年的六个月里,芝加哥热闹非凡。超过 2700 万人涌入这个快速发展的大都市,参加本世纪的盛...

《扩增实境少女TRINARY》的魅力与评价:深度探寻萌系动漫的新时代

扩展女孩三位一体 - 扩展女孩三位一体概述《扩增实境少女 Trinary》是一部于2017年4月12...

这款售价 239 美元的 DJI Mini 4K 无人机肯定会在亚马逊 Prime Day 期间售罄

就在几年前,你还买不到一架售价低于 1,000 美元的像样的摄像无人机。这个价格已经大幅下降,但现在...

新型机械手让深海潜水员能够抓握和刺激

新型遥控机械手将使深海潜水员能够像在空中一样轻松地处理和感受水下物体。这可能会改变深海作业,从海洋生...