国际象棋通常被视为终极智力挑战:8×8 棋盘上有 32 个棋子,几乎有无限可能的走法。有些国际象棋引擎每秒可以计算数百万步,但传统方法是“蛮力”比赛。蛮力是黑客攻击(显然也是计算机国际象棋模拟)中的一种方法,意思是运行问题的所有可能性,直到程序找到最佳解决方案。 但马修·莱希望让会下棋的计算机更聪明。在伦敦帝国理工学院攻读硕士学位期间,莱训练人工神经网络达到国际象棋大师的水平,比 97.8% 的锦标赛选手都高。他将自己的软件称为 Giraffe。 经过 72 小时的训练,长颈鹿在 46% 的时间内找到了最佳走法。长颈鹿选择的走法在 70% 的时间内都位于前 3 步走法中。Lai 说,之前在国际象棋中尝试机器学习的案例,如 Knightcap,需要程序员设计“模式识别器”,即单独的函数来学习诸如用兵保护国王或同时拥有两种颜色的主教的重要性等走法。机器学习算法会观察已经定义的走法,并了解它们的强度。长颈鹿会自动发现这些模式,因此它可以学习程序员甚至都不会考虑的走法。 赖在详细介绍长颈鹿的论文中写道:“长颈鹿的优势不在于它的眼光能够看得很远,而在于它能够准确评估棘手的位置,并理解人类直观的复杂位置概念。” 赖教授利用 1.75 亿个数据点训练他的人工神经网络,该网络通过不断测试推测解决方案的有效性来模仿人类的学习方式。他从人类和其他计算机的游戏中获取了 500 万个初始合法棋盘配置,然后对每个棋盘多次应用随机合法走法。学习过程包括计算机自己下棋,然后根据下一步走法计算它是否会赢。 未经任何训练,Giraffe 在标准化国际象棋引擎测试中得分约为 6,000 分(满分 15,000 分)。经过 72 小时的训练,其得分最高达到 9,700 分。它学会了。 Giraffe 仅次于一款名为 Stockfish 5 的引擎,该引擎自 2008 年开始创建和调试(最初基于 2004 年的 Glaurung 国际象棋引擎构建)。Lai 写道,Giraffe 能够与“精心手工设计的具有数百个参数的庞然大物”抗衡,这对于它的年轻人来说非常了不起,测试套件甚至可能低估了他的程序。 “由于该测试套件非常出名,因此至少有部分引擎可能专门针对该测试套件进行了调整,”Lai 在他的论文中写道。“由于 Giraffe 通过自我对弈发现了所有评估特征,因此它很可能知道一些尚未被人类研究过的模式,因此未将其纳入测试套件。” 下一步是让 Giraffe 更加高效。Lai 建议使用 Giraffe 训练小型网络以提高速度,并使用另一个神经网络进行时间管理。 |
>>: Apple Watch 上的 Airstrip 应用可能会改变我们治疗慢性病的方式
Rockman EXE Stream - 友谊和保护地球的战斗的故事《洛克人战斗网络流》是一部以 C...
种植植物似乎令人生畏,但我们相信任何人都可以创建任何规模的蓬勃发展的家庭温室。我们在这里帮助培养您的...
乌贼( Sepia officinalis )的浑浊墨汁可能有助于阻止鲨鱼在人们游泳的地方附近捕猎。...
尽管他们承认这不太可能,但真正的科学家仍在推测一颗名为 KIC 8462852(又名“塔比星”)的恒...
太空农业的最新进展是使用在类似火星的条件下种植的西红柿制成的番茄酱。亨氏“Marz”番茄酱是一款限量...
1969 年 7 月 20 日,估计有 6.5 亿人怀着忐忑不安的心情观看尼尔·阿姆斯特朗沿着梯子...
本文摘自 2017 年最佳新品榜单。如需查看本年度最具变革性的产品和发现的完整列表,请点击此处。谷歌...
无论你是在开放式办公室,同事们经常路过,还是住在某个地方(比如大学宿舍),你可以放心地将你的笔记本电...
《碟片战争:复仇者联盟》的号召力与评价《碟片战争:复仇者联盟》是一部电视动画系列,于 2014 年 ...
您可能知道,金属杯中的热茶比泡沫中的热茶更难拿起。这是某些材料比其他材料导热性更好的典型例子。这就是...
情绪是研究人员衡量自然或非自然灾害对人们影响的独特方式。然而,询问世界上每个人在灾难发生后的感受是不...
不,最近并没有人看到教皇方济各身穿时髦的北极白色羽绒服穿过梵蒂冈城——但如果你不这么认为,那也情有可...
星球机器人 Danguard Ace 大战昆虫机器人军团 - 电影评论和详情概述《行星机器人丹卫艾斯...
您是否曾好奇过黑暗中究竟发生了什么?借助 4K 夜视数码双筒望远镜,您可以探索未知世界,像科幻电影中...
比利时一家大型工业工厂正式投入运营,该工厂使用 2,240 面抛物面镜收集阳光以产生绿色热能。据制造...