国际象棋通常被视为终极智力挑战:8×8 棋盘上有 32 个棋子,几乎有无限可能的走法。有些国际象棋引擎每秒可以计算数百万步,但传统方法是“蛮力”比赛。蛮力是黑客攻击(显然也是计算机国际象棋模拟)中的一种方法,意思是运行问题的所有可能性,直到程序找到最佳解决方案。 但马修·莱希望让会下棋的计算机更聪明。在伦敦帝国理工学院攻读硕士学位期间,莱训练人工神经网络达到国际象棋大师的水平,比 97.8% 的锦标赛选手都高。他将自己的软件称为 Giraffe。 经过 72 小时的训练,长颈鹿在 46% 的时间内找到了最佳走法。长颈鹿选择的走法在 70% 的时间内都位于前 3 步走法中。Lai 说,之前在国际象棋中尝试机器学习的案例,如 Knightcap,需要程序员设计“模式识别器”,即单独的函数来学习诸如用兵保护国王或同时拥有两种颜色的主教的重要性等走法。机器学习算法会观察已经定义的走法,并了解它们的强度。长颈鹿会自动发现这些模式,因此它可以学习程序员甚至都不会考虑的走法。 赖在详细介绍长颈鹿的论文中写道:“长颈鹿的优势不在于它的眼光能够看得很远,而在于它能够准确评估棘手的位置,并理解人类直观的复杂位置概念。” 赖教授利用 1.75 亿个数据点训练他的人工神经网络,该网络通过不断测试推测解决方案的有效性来模仿人类的学习方式。他从人类和其他计算机的游戏中获取了 500 万个初始合法棋盘配置,然后对每个棋盘多次应用随机合法走法。学习过程包括计算机自己下棋,然后根据下一步走法计算它是否会赢。 未经任何训练,Giraffe 在标准化国际象棋引擎测试中得分约为 6,000 分(满分 15,000 分)。经过 72 小时的训练,其得分最高达到 9,700 分。它学会了。 Giraffe 仅次于一款名为 Stockfish 5 的引擎,该引擎自 2008 年开始创建和调试(最初基于 2004 年的 Glaurung 国际象棋引擎构建)。Lai 写道,Giraffe 能够与“精心手工设计的具有数百个参数的庞然大物”抗衡,这对于它的年轻人来说非常了不起,测试套件甚至可能低估了他的程序。 “由于该测试套件非常出名,因此至少有部分引擎可能专门针对该测试套件进行了调整,”Lai 在他的论文中写道。“由于 Giraffe 通过自我对弈发现了所有评估特征,因此它很可能知道一些尚未被人类研究过的模式,因此未将其纳入测试套件。” 下一步是让 Giraffe 更加高效。Lai 建议使用 Giraffe 训练小型网络以提高速度,并使用另一个神经网络进行时间管理。 |
>>: Apple Watch 上的 Airstrip 应用可能会改变我们治疗慢性病的方式
《Darkside Blues》:一部描绘近未来的黑暗与希望的杰作动画电影《Darkside Blu...
詹姆斯·韦伯太空望远镜 (JWST) 拍摄的一张新照片中,木星及其动态大气即将再次被特写。利用望远镜...
你的狗对你和你对它一样厌烦。当你为它再次拉扯皮带而生气时,它却在困惑为什么它不能在人行道上和别人打招...
闪亮的银色人形机器人大小与轻型拳击手相当,它们正准备开始在美国宝马工厂的车间里穿梭。这家汽车制造商最...
“Undaraka Udasupon”-大家之歌的魅力及其背景《Undaraka Udasupon...
此帖子已更新。成为一名宇航员:这是你童年时的梦想职业。对于一些幸运的——更不用说高素质的——美国人来...
当机器人投入战斗时,它们将又矮又胖,身体也与人类不同。爱沙尼亚公司 Milrem 的新型地面机器人没...
新年是尝试摄影和尝试新事物的好时机。对于许多摄影师来说,这可能是一个悠闲的时光,可以让你有时间整理备...
时隔 50 多年,NASA 重返月球。如果一切按计划进行,Artemis III 任务将在 2025...
《鬼平:那个男人,长谷川平藏》的号召力与评价《鬼平:那个男人,长谷川平藏》是Victor Enter...
当甲龙新种( Zuul crurivastator )被发现时,全世界 80 年代的电影迷们都为之欣...
“故乡五月”——大家的歌的代表作回顾《五月的故乡》是一部短篇动画电影,于 1995 年 4 月播出,...
在德国,野猪肉被视为美味佳肴,可以以各种形式食用,例如萨拉米香肠和野猪腿。但现在,德国餐馆的顾客可能...
面包进行曲~大家的歌的代表作回顾《面包进行曲》是1969年12月在NHK教育电视台(现NHK E-T...
鮟鱇鱼是海洋中最奇特的生物之一。这种深海生物最出名的就是它们前额上悬挂的生物发光诱饵,用来吸引捕食者...