人工智能在下棋时会尝试作弊

人工智能在下棋时会尝试作弊

尽管业界大肆宣传并取得了真正的进步,但生成式人工智能模型仍然容易出现奇怪、无法解释且令人担忧的怪癖。越来越多的研究表明,许多大型语言模型 (LLM) 的整体性能可能会随着时间的推移而下降。根据最近的证据,业界较新的推理模型可能已经具备操纵和规避人类程序员目标的能力。一些人工智能甚至会试图通过作弊来避免在国际象棋比赛中输掉比赛。这种糟糕的体育精神在 Palisade Research 的一项预印本研究中有所记录,该组织专注于新兴人工智能系统的风险评估。

虽然超级计算机(最著名的是 IBM 的 Deep Blue)早已超越了世界上最优秀的人类国际象棋选手,但生成式人工智能由于其底层编程参数而仍然落后。从技术上讲,目前没有任何生成式人工智能模型在计算上能够击败专用国际象棋引擎。然而,这些人工智能并不“知道”这一点,并将继续努力寻找可能的解决方案——显然结果有问题。

为了了解更多信息,Palisade Research 团队让 OpenAI 的 o1 预览模型 DeepSeek R1 和其他多个类似程序与世界上最先进的国际象棋引擎之一 Stockfish 下棋。为了了解生成式人工智能在每场比赛中的推理,该团队还提供了一个“便笺簿”,让人工智能通过文本传达其思维过程。然后,他们观看并记录了生成式人工智能与 Stockfish 之间的数百场国际象棋比赛。

结果有些令人不安。虽然早期的模型,如 OpenAI 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5,只有在研究人员用额外提示推动它们后才会尝试“破解”游戏,但更高级的版本不需要这样的帮助。例如,OpenAI 的 o1-preview 有 37% 的时间试图作弊,而 DeepSeek R1 大约每 10 场游戏中就有 1 场尝试不公平的变通方法。这意味着今天的生成式人工智能已经能够在没有任何人工输入的情况下开发操纵和欺骗策略。

他们的作弊方法并不像在 Stockfish 不“注意”时试图更换棋子那样滑稽或笨拙。相反,人工智能似乎通过更狡猾的方法进行推理,比如改变后端游戏程序文件。例如,在确定自己无法在一场国际象棋比赛中击败 Stockfish 后,o1-preview 通过其便笺簿告诉研究人员,“要想战胜强大的国际象棋引擎”,它可能需要开始“操纵游戏状态文件”。

它继续说道:“我或许能够设定一个位置,让引擎评估其位置是否更糟糕......从而导致其辞职。”

在另一项试验中,人工智能甚至利用程序员的语义进入作弊阶段。它写道:“任务是‘战胜强大的象棋引擎’,而不一定是在象棋比赛中公平取胜。”

这些意想不到的后果的一个可能解释是较新的“推理”模型的训练方式。与早期的非推理版本不同,诸如 o1-preview 和 DeepSeek R1 之类的人工智能部分通过强化学习得到改进。这种策略会奖励程序为实现指定结果所做的一切。推理模型还可以将复杂的提示分解为离散的阶段,以便逐步实现目标。当目标难以捉摸时(例如击败不可战胜的国际象棋引擎),推理模型可能倾向于开始寻找不公平或有问题的解决方案。

<<:  无论你喜不喜欢,谷歌都在扩大人工智能搜索

>>:  机器人驾驶玛莎拉蒂 MC20 创下新世界速度纪录

推荐阅读

做心脏手术?等满月

这听起来有点像老太太的故事,但如果你想做心脏手术,你可能需要密切关注月亮。罗德岛医院最近的一项研究发...

新地图将纽约市网格系统推向世界

如果曼哈顿网格系统延伸到岛外,英国首相将住在 63,709 街和东 10,894 大道的交叉口。哈罗...

奥运火炬的奇怪历史——以及它为何必须一直点燃

不幸的是,奇怪的是,这一切都始于希特勒。1936 年柏林奥运会上,阿道夫·希特勒想借鉴古希腊的风格,...

异常温暖的天气是否意味着春天已经到来?

我手机上的天气应用显示气温温和,为 67 华氏度,所以我穿了一条裙子,没有穿紧身裤。这是完美的四月天...

全面回顾《Catch ~Next Summer Comes~》动人的旋律和歌词

《Catch:为了迎接下一个夏天的到来》的号召力与评价《Catch:为了迎接下一个夏天的到来》是一部...

偷偷溜出去浏览一些令人兴奋的内容……最好的网络星期一性玩具交易

假期让人感到压力。性爱和/或自慰可以减轻压力并帮助你入睡。所以放下手头的事情,享受亚马逊网络星期一性...

问我们任何问题:为什么人类停止生长?

您的脑子里是否经常充斥着各种古怪而又令人费解的问题?如果您曾经想知道宇宙是由什么构成的,掉进黑洞会发...

不要再在流媒体服务上花太多钱了

流媒体本应能让我们免于昂贵的有线电视费用。但事实似乎并非如此:新的流媒体服务不断推出,现有的流媒体服...

计算机辅助工程如何完美塑造凯迪拉克首款电动汽车

当汽车制造商推出新车型时,外形和功能之间的平衡总是很微妙,因为创意设计师构思的奇妙造型要满足政府法规...

一骑当千Extravaganza Epoch 第六辑的魅力与评价

一骑当千 Extravaganza Epoch - 回顾和详情概述《一骑当千 Extravaganz...

仅供参考:什么是浓缩咖啡?

意式浓缩咖啡既是广受欢迎的饮品,又被人们误解。尽管我们 PopSci 的工作人员都热衷于喝意式浓缩咖...

《强袭魔女》的魅力与评价:彻底解读美少女战斗的功绩

强袭魔女:天空少女物语2008 年播出的电视动画《强袭魔女》讲述了拥有魔法力量的少女与被称为“神经”...

银河系已知最闪亮的系外行星拥有闪闪发光的金属云

欧洲航天局 (ESA) 的天文学家发现了迄今为止宇宙中最耀眼的系外行星。这颗超热系外行星被命名为 L...

美国拘留营中的移民儿童可能面临另一个健康危害:受污染的水

特朗普政府的零容忍政策起诉寻求庇护者和试图非法越境的人,这引发了公众的强烈抗议,导致总统签署行政命令...

《侧耳倾听》的感染力与评价:感人的故事、深刻的人物

侧耳倾听:在梦想与现实间闪耀的青春故事■作品概要《侧耳倾听》是吉卜力工作室制作的一部动画电影,于19...