人工智能让计算机象棋不再只是依靠蛮力

国际象棋通常被视为终极智力挑战：8×8 棋盘上有 32 个棋子，几乎有无限可能的走法。有些国际象棋引擎每秒可以计算数百万步，但传统方法是“蛮力”比赛。蛮力是黑客攻击（显然也是计算机国际象棋模拟）中的一种方法，意思是运行问题的所有可能性，直到程序找到最佳解决方案。

但马修·莱希望让会下棋的计算机更聪明。在伦敦帝国理工学院攻读硕士学位期间，莱训练人工神经网络达到国际象棋大师的水平，比 97.8% 的锦标赛选手都高。他将自己的软件称为 Giraffe。

经过 72 小时的训练，长颈鹿在 46% 的时间内找到了最佳走法。长颈鹿选择的走法在 70% 的时间内都位于前 3 步走法中。Lai 说，之前在国际象棋中尝试机器学习的案例，如 Knightcap，需要程序员设计“模式识别器”，即单独的函数来学习诸如用兵保护国王或同时拥有两种颜色的主教的重要性等走法。机器学习算法会观察已经定义的走法，并了解它们的强度。长颈鹿会自动发现这些模式，因此它可以学习程序员甚至都不会考虑的走法。

赖在详细介绍长颈鹿的论文中写道：“长颈鹿的优势不在于它的眼光能够看得很远，而在于它能够准确评估棘手的位置，并理解人类直观的复杂位置概念。”

赖教授利用 1.75 亿个数据点训练他的人工神经网络，该网络通过不断测试推测解决方案的有效性来模仿人类的学习方式。他从人类和其他计算机的游戏中获取了 500 万个初始合法棋盘配置，然后对每个棋盘多次应用随机合法走法。学习过程包括计算机自己下棋，然后根据下一步走法计算它是否会赢。

未经任何训练，Giraffe 在标准化国际象棋引擎测试中得分约为 6,000 分（满分 15,000 分）。经过 72 小时的训练，其得分最高达到 9,700 分。它学会了。

Giraffe 仅次于一款名为 Stockfish 5 的引擎，该引擎自 2008 年开始创建和调试（最初基于 2004 年的 Glaurung 国际象棋引擎构建）。Lai 写道，Giraffe 能够与“精心手工设计的具有数百个参数的庞然大物”抗衡，这对于它的年轻人来说非常了不起，测试套件甚至可能低估了他的程序。

“由于该测试套件非常出名，因此至少有部分引擎可能专门针对该测试套件进行了调整，”Lai 在他的论文中写道。“由于 Giraffe 通过自我对弈发现了所有评估特征，因此它很可能知道一些尚未被人类研究过的模式，因此未将其纳入测试套件。”

下一步是让 Giraffe 更加高效。Lai 建议使用 Giraffe 训练小型网络以提高速度，并使用另一个神经网络进行时间管理。

<<: 四名未被捕的儿童发明家和一名被捕的儿童发明家

>>: Apple Watch 上的 Airstrip 应用可能会改变我们治疗慢性病的方式