人工智能在下棋时会尝试作弊

人工智能在下棋时会尝试作弊

尽管业界大肆宣传并取得了真正的进步,但生成式人工智能模型仍然容易出现奇怪、无法解释且令人担忧的怪癖。越来越多的研究表明,许多大型语言模型 (LLM) 的整体性能可能会随着时间的推移而下降。根据最近的证据,业界较新的推理模型可能已经具备操纵和规避人类程序员目标的能力。一些人工智能甚至会试图通过作弊来避免在国际象棋比赛中输掉比赛。这种糟糕的体育精神在 Palisade Research 的一项预印本研究中有所记录,该组织专注于新兴人工智能系统的风险评估。

虽然超级计算机(最著名的是 IBM 的 Deep Blue)早已超越了世界上最优秀的人类国际象棋选手,但生成式人工智能由于其底层编程参数而仍然落后。从技术上讲,目前没有任何生成式人工智能模型在计算上能够击败专用国际象棋引擎。然而,这些人工智能并不“知道”这一点,并将继续努力寻找可能的解决方案——显然结果有问题。

为了了解更多信息,Palisade Research 团队让 OpenAI 的 o1 预览模型 DeepSeek R1 和其他多个类似程序与世界上最先进的国际象棋引擎之一 Stockfish 下棋。为了了解生成式人工智能在每场比赛中的推理,该团队还提供了一个“便笺簿”,让人工智能通过文本传达其思维过程。然后,他们观看并记录了生成式人工智能与 Stockfish 之间的数百场国际象棋比赛。

结果有些令人不安。虽然早期的模型,如 OpenAI 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5,只有在研究人员用额外提示推动它们后才会尝试“破解”游戏,但更高级的版本不需要这样的帮助。例如,OpenAI 的 o1-preview 有 37% 的时间试图作弊,而 DeepSeek R1 大约每 10 场游戏中就有 1 场尝试不公平的变通方法。这意味着今天的生成式人工智能已经能够在没有任何人工输入的情况下开发操纵和欺骗策略。

他们的作弊方法并不像在 Stockfish 不“注意”时试图更换棋子那样滑稽或笨拙。相反,人工智能似乎通过更狡猾的方法进行推理,比如改变后端游戏程序文件。例如,在确定自己无法在一场国际象棋比赛中击败 Stockfish 后,o1-preview 通过其便笺簿告诉研究人员,“要想战胜强大的国际象棋引擎”,它可能需要开始“操纵游戏状态文件”。

它继续说道:“我或许能够设定一个位置,让引擎评估其位置是否更糟糕......从而导致其辞职。”

在另一项试验中,人工智能甚至利用程序员的语义进入作弊阶段。它写道:“任务是‘战胜强大的象棋引擎’,而不一定是在象棋比赛中公平取胜。”

这些意想不到的后果的一个可能解释是较新的“推理”模型的训练方式。与早期的非推理版本不同,诸如 o1-preview 和 DeepSeek R1 之类的人工智能部分通过强化学习得到改进。这种策略会奖励程序为实现指定结果所做的一切。推理模型还可以将复杂的提示分解为离散的阶段,以便逐步实现目标。当目标难以捉摸时(例如击败不可战胜的国际象棋引擎),推理模型可能倾向于开始寻找不公平或有问题的解决方案。

<<:  无论你喜不喜欢,谷歌都在扩大人工智能搜索

>>:  机器人驾驶玛莎拉蒂 MC20 创下新世界速度纪录

推荐阅读

高速动作捕捉技术帮助奥运选手游得更好

在游泳中,姿势和力量同样重要。顶尖选手对细节的把握——哪怕是脚踝的角度——都恰到好处,因为这可能意味...

具有触觉的意念控制机械手

丹尼斯·阿博·索伦森 (Denis Aabo Sørensen) 九年前在玩烟花时失去了左手。从那以...

60 多项 Prime Day 最佳家居和厨房用品特惠

如果厨房被视为家庭的核心,那么您可以通过升级小家电来让您的脉搏加速,这要归功于亚马逊 2024 年 ...

无需烧开水即可产生蒸汽,只需添加阳光和纳米颗粒

如今,纳米粒子可以实现令人难以置信的酷炫功能:德克萨斯州莱斯大学的一组研究人员展示了一种机制,他们只...

《PEACE MAKER 黑铁由美》剧场版:动人的故事和美丽的视觉效果的全面回顾

“PEACE MAKER 黑铁友峰”:历史与青春交织的战场2018年11月17日上映的动画电影《PE...

NG Knight Ramune&40合辑:重新评价魅力冒险

NG Knight Ramune&40 Collection - 迷人的OVA世界1991年发售的O...

我们家的稻荷神社。 ~全面了解迷人的角色和动人的故事~

我们家的稻荷神社。 - 我亲爱的朋友。 - ■ 公共媒体电视动画系列■ 原创媒体轻小说■ 播出时间2...

本周我们了解到的最奇怪的事情:味道最香的烟蒂、火焰鸟和 40 桶可乐

本周你学到的最奇怪的事情是什么?好吧,不管是什么,我们保证如果你听 PopSci 的热门播客,你会得...

图画展览会:欣赏艺术与动画的融合

《图画展览会》详细评论及推荐 - Tenrankainoe ■ 公共媒体独立制作■ 原创媒体动漫原创...

如何使用 Google 地图上的新“繁忙区域”图标

无论您讨厌人群,还是喜欢被四面八方的人潮挤来挤去,Google 地图都有适合您的工具。这项名为“区域...

抚平小腹的歌曲:《大家的歌》的魅力与评价

“让人饿的歌”——回顾大家的代表作歌曲《平胃歌》是大家耳熟能详的经典歌曲之一,1962年8月在NHK...

猫和狗记得它们的过去吗?

你对你的宠物了解多少?《宠物通灵者》收集了你对 BFF(永远的动物朋友)的一些想法,并将它们与现代科...

《Kemono Chat》评论:深入了解与动物交谈的独特体验

“与动物聊天”:可以与猫咪对话的新型猫咪动画的魅力■作品概要《与兽聊天》于 2009 年 10 月 ...

PEACH COMMAND 新桃太郎传奇 - 以现代视角重新解读经典并对其进行评价

《PEACH COMMAND 新桃太郎传说》:桃太郎在宇宙中的新冒险1990年代初期在东京电视台播出...

《沙漠玫瑰:雪灾》的魅力与评价:深刻的故事与视觉的融合

沙雪末日的玫瑰 - 沙玫瑰雪末日概述《沙漠玫瑰:雪之启示录》于 1993 年 4 月 25 日以 O...