人工智能在下棋时会尝试作弊

人工智能在下棋时会尝试作弊

尽管业界大肆宣传并取得了真正的进步,但生成式人工智能模型仍然容易出现奇怪、无法解释且令人担忧的怪癖。越来越多的研究表明,许多大型语言模型 (LLM) 的整体性能可能会随着时间的推移而下降。根据最近的证据,业界较新的推理模型可能已经具备操纵和规避人类程序员目标的能力。一些人工智能甚至会试图通过作弊来避免在国际象棋比赛中输掉比赛。这种糟糕的体育精神在 Palisade Research 的一项预印本研究中有所记录,该组织专注于新兴人工智能系统的风险评估。

虽然超级计算机(最著名的是 IBM 的 Deep Blue)早已超越了世界上最优秀的人类国际象棋选手,但生成式人工智能由于其底层编程参数而仍然落后。从技术上讲,目前没有任何生成式人工智能模型在计算上能够击败专用国际象棋引擎。然而,这些人工智能并不“知道”这一点,并将继续努力寻找可能的解决方案——显然结果有问题。

为了了解更多信息,Palisade Research 团队让 OpenAI 的 o1 预览模型 DeepSeek R1 和其他多个类似程序与世界上最先进的国际象棋引擎之一 Stockfish 下棋。为了了解生成式人工智能在每场比赛中的推理,该团队还提供了一个“便笺簿”,让人工智能通过文本传达其思维过程。然后,他们观看并记录了生成式人工智能与 Stockfish 之间的数百场国际象棋比赛。

结果有些令人不安。虽然早期的模型,如 OpenAI 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5,只有在研究人员用额外提示推动它们后才会尝试“破解”游戏,但更高级的版本不需要这样的帮助。例如,OpenAI 的 o1-preview 有 37% 的时间试图作弊,而 DeepSeek R1 大约每 10 场游戏中就有 1 场尝试不公平的变通方法。这意味着今天的生成式人工智能已经能够在没有任何人工输入的情况下开发操纵和欺骗策略。

他们的作弊方法并不像在 Stockfish 不“注意”时试图更换棋子那样滑稽或笨拙。相反,人工智能似乎通过更狡猾的方法进行推理,比如改变后端游戏程序文件。例如,在确定自己无法在一场国际象棋比赛中击败 Stockfish 后,o1-preview 通过其便笺簿告诉研究人员,“要想战胜强大的国际象棋引擎”,它可能需要开始“操纵游戏状态文件”。

它继续说道:“我或许能够设定一个位置,让引擎评估其位置是否更糟糕......从而导致其辞职。”

在另一项试验中,人工智能甚至利用程序员的语义进入作弊阶段。它写道:“任务是‘战胜强大的象棋引擎’,而不一定是在象棋比赛中公平取胜。”

这些意想不到的后果的一个可能解释是较新的“推理”模型的训练方式。与早期的非推理版本不同,诸如 o1-preview 和 DeepSeek R1 之类的人工智能部分通过强化学习得到改进。这种策略会奖励程序为实现指定结果所做的一切。推理模型还可以将复杂的提示分解为离散的阶段,以便逐步实现目标。当目标难以捉摸时(例如击败不可战胜的国际象棋引擎),推理模型可能倾向于开始寻找不公平或有问题的解决方案。

<<:  无论你喜不喜欢,谷歌都在扩大人工智能搜索

>>:  机器人驾驶玛莎拉蒂 MC20 创下新世界速度纪录

推荐阅读

绝对不能错过的动画体验——《Engimon》的魅力与评价

讲述护身符与孩子们的梦想的冒险的动画《魔法使》 ■ 公共媒体剧院■ 原创媒体动漫原创■ 发布日期20...

短篇动画《真がそばに ...�すぎる》的魅力与评价

Mayonaka Punch 短篇动漫 - Mayonaka Punch 短篇动漫■ 公共媒体网络■...

通过这款配对游戏解读神秘的声音

我们知道您现在待在家里很无聊——我们也是。这里有一些谜题和智力题,您可以亲自或通过视频聊天挑战您的家...

《3D彼女真人秀》第二季的号召力与评价

《3D彼女真人秀第二季》的魅力与评价《3D彼女真人秀第二季》是改编自七海真央同名漫画的电视动画,于2...

电视连续剧《黄金神威》第一季的魅力与评价:北海道的冒险与生存

《黄金神威》第一季的号召力与评价《黄金神威》是改编自野田聪同名漫画的电视动画,于2018年4月9日至...

《文豪野犬》第一季的魅力与评价:为什么它是必看的?

《文豪野犬》第一季的魅力与评价《文豪野犬》是一部电视动画系列,改编自朝雾卡夫卡和春川35的漫画,于...

这个小贴纸比巨型三星 Galaxy Note II 还要大

任何时候,科技界都会出现一大堆流行术语和概念,它们在不断演变,最终成为我们所有人都能实际使用和享受的...

这位 7 世纪的少女下葬时佩戴着华丽的珠宝——我们现在知道她可能长什么样子

头骨分析正在帮助英国考古学家重建一名公元 7 世纪 16 岁女性的面容。这名女性被埋葬在英国剑桥附近...

这种巨型等足动物生活在灭绝恐龙的小行星陨石坑中

墨西哥尤卡坦半岛附近的希克苏鲁伯陨石坑与恐龙的灭绝息息相关。6600 万年前,一颗小行星撞击地球,造...

你不知道 Android 和 iOS 互相抄袭的 20 个功能

史蒂夫乔布斯曾说过,他并不反对窃取一两个好主意,随着 iOS 14 即将推出,人们开始谈论苹果从谷歌...

飞翔的企鹅:彻底解析《大家的歌》的魅力与情感

飞翔的企鹅的魅力与评价 - Soratobu Penguin 1989年2月,NHK教育电视台(现为...

《交响情人梦》的号召与评价:音乐与青春的和谐

《交响情人梦》:古典音乐与青春的和谐■ 公共媒体电视动画系列■ 原创媒体漫画■ 播出时间2007年1...

Shutterstock 和 OpenAI 提出了一个可能的解决方案,以解决人工智能艺术品的所有权问题

文化病毒式传播的库存照片和偶然成为库存照片名人的时代可能已经一去不复返了。未来的库存照片可能不需要真...

一睹宝马位于德国的未来模拟中心

位于慕尼黑宝马工厂的 Sapphire 汽车动态模拟器由一个巨大的白色气泡组成,让人想起《捉鬼敢死队...

从旅途到路线图:Rockford Fosgate 扬声器开发流程

“别忘了呼吸。”这是我在门关上前听到的最后一句话,我忘记了呼吸。我被气压呛得喘不过气来,因位移而迷失...