古老棋盘游戏引发谷歌与 Facebook 的新竞争

古老棋盘游戏引发谷歌与 Facebook 的新竞争

当 IBM 的“深蓝”计算机击败国际象棋大师加里·卡斯帕罗夫时,全世界都注意到了。机器在人类自己设计的游戏中战胜了人类。机器能做什么的规则已经改变。

但如今,这样的时刻(1997 年《大众科学》杂志称之为“全世界都听到的将军” )越来越少了。在一个二元对立的世界里,人工智能要么在公开场合慢慢改进,比如虚拟个人助理,要么在服务器层面进行调整,以提供更好的定制内容或面部识别,这些基准时刻通常更加模糊。

今天(以及昨晚深夜),两家在人工智能方面投入巨资的公司都在试图达到同一项基准,即在古老的中国围棋游戏中击败人类玩家。

在过去的 24 小时内,谷歌 DeepMind 和 Facebook 的人工智能研究实验室都宣布他们的算法可以在极高的水平上表现出色。谷歌在这次声明中占据了更正式的领先地位,它在《自然》杂志上发表了一篇文章,并在 10 月份的真实场景中,名为 AlphaGo 的计算机击败了欧洲围棋卫冕冠军范麾。Facebook 的软件在在线围棋服务器 KGS 举办的每月机器人比赛中名列第三。

谷歌 DeepMind 声称,他们要达到击败人类卫冕冠军的水平,此前的估计需要 5 到 10 年的时间,这证明了我们人工智能研究的加速,而 Facebook 则表示,他们的算法已经取得了稳步、可量化的进步。

对于 Google 或 Facebook 用户来说,这对于用户体验来说都不是重大事件。事实上,它可能根本不会影响服务的提供方式。它确实表明,研究人员在应用现有算法方面取得了显著进步,在这种情况下,算法是一种擅长处理视觉信息的深度神经网络。这意味着算法可以更好地检测模式,并更简单地表达其结论。在未来,这将意味着更好的结果。

现在,它只是意味着计算机在某件事上更加优秀了。

然而,Facebook 创始人兼首席执行官马克·扎克伯格却借此机会展示自己的研究实力,在他个人 Facebook 页面上发布了公司取得的成就,而这可疑的发生时间是谷歌 DeepMind 发布声明的前一天。

两家公司都使用了深度卷积神经网络的某种组合,这种网络实际上是由 Facebook 的 Yann LeCun 在贝尔实验室发明的,还有基于之前围棋比赛的数百万个数据点。

典型的围棋棋盘。自然

围棋是双人游戏,在 19×19 的棋盘上进行。每回合,玩家放置一个圆形棋子(称为棋子),试图吃掉对方的棋子。一方用黑棋代表,另一方用白棋代表。由于围棋有 361 个潜在棋位,每个棋位的吸引力随着每一步而变化,因此围棋可以看作是无限复杂的,需要人类的创造力来制定策略以智取对手。

谷歌的方法

谷歌使用了两个卷积神经网络来控制走哪一步。这些卷积神经网络与面部识别和识别图像中的物体所使用的方式相同,因为它们分解数据的方式与计算机描述像素的方式完美契合。系统首先会得到棋盘的描述:哪些位置是白棋,哪些位置是黑棋,哪些位置无人认领。第一个神经网络称为策略网络,它输出人类棋手走每一步潜在棋步的概率。这是一个相对较快的过程,因为计算机已经查看了之前围棋比赛中的 3000 万个位置,这个过程称为训练。在训练中,计算机会输入所有位置数据和每个位置的结果。据此,它可以对如何对潜在棋步进行最佳评分进行排名。这很像观看足球运动员或拳击手的比赛录像,只不过计算机永远不会忘记任何一步棋。

Google DeepMind 的 AlphaGo 软件与法国围棋大师范麾的对决结果。Google DeepMind

第二个网络是决策者。这是 DeepMind 称之为价值网络的另一个卷积神经网络。它将所有这些概率输出一个数字,该数字对应于哪一步最有可能赢得整个游戏。

该系统曾击败过世界顶尖围棋冠军之一(五次!),并且在 Google 的测试中,在 495 场比赛中 494 场击败了其他顶尖虚拟围棋选手,获胜率为 99.8%。

Facebook 的方法

Facebook 在围棋方面的尝试则更加多样化。他们没有使用两个卷积网络,而是只使用了一个,但结合了另一种机器学习形式,即蒙特卡洛树搜索。Facebook 的 Yann LeCun 表示,这是一种随机搜索,可以探索在训练中学习到的许多潜在动作,如前所述。卷积网络的功能几乎与 Google 的策略网络一样,可以预测最佳潜在下一步动作,依靠 MCTS 来实际探索学习到的动作。然而,值得注意的是,Facebook 有一位研究人员在研究这个问题(尽管他离马克·扎克伯格只有 20 英尺),而 DeepMind Nature文章有 20 位合著者。

未来,谷歌 DeepMind 的 AlphaGo 将挑战人类围棋大师李世石,后者被认为是世界上最优秀的围棋选手。比赛将于 2016 年 3 月举行(我们会告诉您比赛结果)。Facebook 的 LeCun 表示,他们的模型仍在开发中,但未来将着眼于融入其他类型的深度学习。

<<:  亚马逊 Echo 超级碗广告即将推出

>>:  这艘船是一艘气垫船,直到它变成一架飞机

推荐阅读

控制、驱赶和赶走蛇的最佳方法

随着天气开始变冷,许多动物开始冬眠。陆龟开始挖洞,熊开始增肥过冬,科普作家开始稳定地喝热巧克力和吃奶...

购买《Little Busters!》全系列时,作为特别赠送的OVA的魅力与评价。

小小克星!购买全系列时可额外获得 OVA 的魅力和评价小小克星!是一部根据 Key 创作的 18+ ...

猪可以玩电子游戏。这就是为什么它很重要。

丽贝卡·E·诺德奎斯特 (Rebecca E. Nordquist) 是乌得勒支大学兽医学助理教授。...

ONI 的魅力与评价:对故事动作和深度的透彻解释

ONI - 深海传说与魅力1995年至1996年播出的电视动画《当真鬼神传ONI》以其独特的世界观和...

史前骨骼碎片引发对早期人类食人行为的质疑

从现实生活中注定沉沦的十九世纪捕鲸船埃塞克斯号的船员,到热播电视剧《黄蜂女》第二季中虚构却可怕的足球...

在 Barnes & Noble 购买 Criterion Collection 电影可享 50% 折扣

我们测试了很多设备,这意味着我们喜欢好的演示光盘。如果你和我们一样是个电影爱好者,愿意投资购买最精美...

这些蜘蛛为幼崽制作富含蛋白质的乳汁

蜘蛛奶听起来像是在《哈利·波特》中斯内普教授的魔药课上能找到的一种虚构成分,但中国科学家发现至少一种...

《舞动舞者》的号召力与口碑:透彻解析这个动人的舞蹈故事

《舞蹈舞者》:描绘芭蕾世界的动人故事《舞舞舞者》是改编自朝仓乔治的原作漫画的电视动画。该剧于 202...

为什么生物多样性无法定价

给必需品贴上价格标签永远都是一项挑战。气候危机一再向我们表明,我们很难估计产品的实际价值——无论是最...

令人讨厌的学长的故事:探索迷人角色和故事的深度

《烦人前辈的故事》:一部描绘职场关系的新型喜剧动画2021年秋季播出的《我的烦人前辈》(以下简称《我...

阿波罗 13 号的机组人员什么时候知道他们失去了月球?

阿波罗 13 号飞行 46 小时 43 分钟后,太空通讯员乔·克尔温向指挥官吉姆·洛威尔汇报了任务最...

能源解决方案:工程技术战胜波浪和潮汐力

底部进料器水的密度是空气的 800 倍,建造一台能够承受其产生的巨大力量的发电机阻碍了下一代水力发电...

《幽游式》评论:一部描绘日常生活小趣事的舒缓动漫

《Yuyushiki》- 为年轻人的日常生活增添色彩的欢笑和友情故事《Yuyushiki》是一部 2...

2024 款宾利欧陆 GT 的热成像摄像头非常有趣

简单概括一下这款售价 35 万美元的宾利欧陆 GT 轿跑车,那就是它颠覆了人们的认知。撇开价格冲击不...

太阳能公司希望将太阳能电池板直接固定在地面上

过去十年,太阳能电网安装成本急剧下降,2021 年的阵列平均成本比 2010 年便宜近 90%。这得...