国际象棋通常被视为终极智力挑战:8×8 棋盘上有 32 个棋子,几乎有无限可能的走法。有些国际象棋引擎每秒可以计算数百万步,但传统方法是“蛮力”比赛。蛮力是黑客攻击(显然也是计算机国际象棋模拟)中的一种方法,意思是运行问题的所有可能性,直到程序找到最佳解决方案。 但马修·莱希望让会下棋的计算机更聪明。在伦敦帝国理工学院攻读硕士学位期间,莱训练人工神经网络达到国际象棋大师的水平,比 97.8% 的锦标赛选手都高。他将自己的软件称为 Giraffe。 经过 72 小时的训练,长颈鹿在 46% 的时间内找到了最佳走法。长颈鹿选择的走法在 70% 的时间内都位于前 3 步走法中。Lai 说,之前在国际象棋中尝试机器学习的案例,如 Knightcap,需要程序员设计“模式识别器”,即单独的函数来学习诸如用兵保护国王或同时拥有两种颜色的主教的重要性等走法。机器学习算法会观察已经定义的走法,并了解它们的强度。长颈鹿会自动发现这些模式,因此它可以学习程序员甚至都不会考虑的走法。 赖在详细介绍长颈鹿的论文中写道:“长颈鹿的优势不在于它的眼光能够看得很远,而在于它能够准确评估棘手的位置,并理解人类直观的复杂位置概念。” 赖教授利用 1.75 亿个数据点训练他的人工神经网络,该网络通过不断测试推测解决方案的有效性来模仿人类的学习方式。他从人类和其他计算机的游戏中获取了 500 万个初始合法棋盘配置,然后对每个棋盘多次应用随机合法走法。学习过程包括计算机自己下棋,然后根据下一步走法计算它是否会赢。 未经任何训练,Giraffe 在标准化国际象棋引擎测试中得分约为 6,000 分(满分 15,000 分)。经过 72 小时的训练,其得分最高达到 9,700 分。它学会了。 Giraffe 仅次于一款名为 Stockfish 5 的引擎,该引擎自 2008 年开始创建和调试(最初基于 2004 年的 Glaurung 国际象棋引擎构建)。Lai 写道,Giraffe 能够与“精心手工设计的具有数百个参数的庞然大物”抗衡,这对于它的年轻人来说非常了不起,测试套件甚至可能低估了他的程序。 “由于该测试套件非常出名,因此至少有部分引擎可能专门针对该测试套件进行了调整,”Lai 在他的论文中写道。“由于 Giraffe 通过自我对弈发现了所有评估特征,因此它很可能知道一些尚未被人类研究过的模式,因此未将其纳入测试套件。” 下一步是让 Giraffe 更加高效。Lai 建议使用 Giraffe 训练小型网络以提高速度,并使用另一个神经网络进行时间管理。 |
>>: Apple Watch 上的 Airstrip 应用可能会改变我们治疗慢性病的方式
超神传说 鱼月童子概述《超人传说Urotsuki Douji》是一部 1989 年的日本动画电影,改...
深空气候观测站(简称 DSCOVR)是地球轨道上一颗被低估的宝石。这颗卫星是美国宇航局和美国国家海洋...
2008 年,当史蒂夫·乔布斯发布 iPhone 3G 时,这款设备实现了一次重大飞跃。此次更新意味...
人类和机器都在以前所未有的速度接近未来。几乎每年,我们的交通工具都会打破速度记录。去年秋天,X-43...
《魔神勇者乩:无尽时空物语》:跨越时空的勇者的新冒险《魔神勇者传:无尽的时间物语》于 1993 年以...
Google Pixel 3 发布会。Stan Horaczek今天,谷歌将在纽约举办一场活动,发布...
《蓝色童话》:NHK动画短片描绘的美丽世界《蓝色童话》是2001年10月在NHK教育电视台(现NHK...
该套件售价 159 美元,包含您入门所需的一切。不过,如果您不放心自己安装,请务必考虑专业安装的成本...
这篇文章已更新。它最初于 2017 年 12 月 9 日发布。在电脑和手机上记数字笔记比以往任何时候...
近两个世纪以来,人类一直在从地球表面改变大气层——但现在在太空时代,我们也在从外太空改变大气层。大气...
数字时代正在蓬勃发展,随之而来的是,对熟练 IT 专业人员的需求也随之增长。如果您曾经考虑过从事这一...
京滨化工 - 京滨化工综合评价与推荐■ 公共媒体《京滨家族》是一部原创动画系列,于 2009 年 1...
在过去的几十年里,“未来汽车”的承诺一直未能实现,而它本应解决的问题却愈演愈烈。每加仑汽油的平均价格...
如需了解更多交易和产品信息,请查看我们的专属 Facebook 群组。...
让这个想法在你心中生根发芽:用蘑菇来清理肮脏、受污染的城市河流。这正是俄勒冈州环保主义者正在尝试的。...