教会自己虚张声势的计算机

教会自己虚张声势的计算机

熟能生巧,即使你恰好是一个人工智能。

这是阿尔伯塔大学的 Michael Bowling 领导的一项实验的前提,该实验设置了一个名为 Cepheus 的程序,让它与自己玩一亿亿(是的,一亿亿亿)手扑克变体游戏,即单挑限注德州扑克。Cepheus 在 4,600 个 CPU 上运行,每秒计算 60 亿手牌,从每次胜利、平分底池和失败中学习。在实际 70 天中,相当于 CPU 1,000 年的时间后,Cepheus 玩的扑克牌比整个人类玩的还要多。在发表在《科学》杂志上的一篇论文中,Bowling 团队宣布,他们利用 Cepheus 有效地“解决”了单挑限注德州扑克 - 这意味着该程序的决策非常接近完美,以至于没有办法看看一个理论上完美的人类在 70 年的时间里,每天 12 小时,每小时玩 200 手牌是否能做得更好。

统计学家对“解决”游戏的定义有些晦涩难懂,因为 Cepheus 实际上并非每局都不可战胜——恰恰是因为游戏中存在不可消除的运气因素。如果拿到一手烂牌,狡猾的职业选手可能会输给业余选手。

该程序的决策如此接近完美,以至于无法看出理论上完美的人类是否能做得更好。

“最糟糕的情况可能是你手上有一手好牌,而你的对手手上有一手更好的牌,”这项研究的合著者迈克·约翰逊说。“你认为自己会赢,所以你下了很多赌注,结果输了很多钱。”

但一旦统计噪声的影响在数千手牌中消失,Cepheus 的技能保证它不会在长期内亏损。

“第一步是建立一个能够击败人类专家的程序,我们在 2008 年就做到了,”约翰逊说。“我们在论文中宣布,Cepheus 能够完美地下棋,不会犯错误。”

在研究中使用的德州扑克版本中,两名玩家(“单挑”)使用固定(“限制”)赌注大小进行比赛,并且有两张牌是隐藏的。这里真正新颖的是 Cepheus 必须学会在对手持有的牌有如此“不完全信息”的情况下做出决定。尽管计算机科学家之前已经解决了 Connect Four 或 Checkers 等“完全信息”游戏,其中计算机完全了解之前的走法和可能的未来结果,但艾伯塔省的研究是人类玩的不平凡的不完全信息游戏的第一个解决方案。

“而 Cepheus 必须学会如何在没有人类专家帮助的情况下下棋,”Johanson 说。“我们教它规则,然后它自己进行训练,弄清楚如何慢棋和虚张声势等棘手的心理问题。”

虚张声势是指玩家手中的牌很弱,但为了欺骗对手弃牌而积极下注。慢玩则相反;手中的牌很强,玩家希望谨慎下注,以诱使对手留在游戏中进行更多下注。而关于其他玩家手中牌的“不完全信息”传统上使得这些心理战术很难被计算机处理。直到现在。还有那数以亿计的德州扑克牌。可以肯定地说,Cepheus 已经见识过扑克玩家可能尝试使用的所有技巧。

您可以在线与 Cepheus 对战,或者向它询问策略问题。

尽管扑克牌生意很大,但计算机科学家更感兴趣的是将其作为基准。约翰逊预计,其他领域的博弈论者也会将这种方法应用于不完全信息占主导地位的其他领域,如谈判或反恐。

例如,南加州大学教授米林德·坦贝 (Milind Tambe) 开发了一种名为 ARMOR 的博弈论工具,洛杉矶国际机场和联邦空中警察均使用该工具来安排巡逻和检查站,这种方式既结合了随机性,又权衡了潜在威胁。

机场安检可以理解为一场像象棋一样的策略游戏。

对于约翰逊来说,机场安检可以理解为一场像象棋一样的策略游戏。

“可以把它想象成国际象棋,只不过军队规模不同。机场有多个棋子,代表安保人员,也可能是炸弹嗅探犬和检查站。也许恐怖分子只有一个棋子,但它是一枚好棋子,就像皇后一样,可以自由移动并攻击机场最薄弱的地方。”

就像单挑限注德州扑克一样,机场安检中的双方对于对手将采取什么行动都没有完全的信息。

“所以你把板子藏起来了,”约翰逊说。“你不知道恐怖分子什么时候会袭击,但你知道袭击很可能会发生。恐怖分子知道那里有安保,但不知道具体在哪里。”

将洛杉矶国际机场这样复杂、庞大的机场重新设想为棋盘说起来容易做起来难。但我们希望,就像仙王座通过数万亿轮练习学会了虚张声势和慢打法一样,明天重复的人工智能安全模拟将发现我们凡人从未想过的漏洞。

<<:  他们现在在哪里:回顾 2014 年 CES 上的顶级潜力股

>>:  巨石能阻止超速行驶的卡车吗?一项有力的新研究调查了

推荐阅读

《Re:Stage!Dream Days》的魅力与评价:追寻偶像梦想的动人故事

《Re:Stage!Dream Days》梦想与青春的故事《Re:Stage!Dream Days》...

某科学的超电磁炮:角色的深度与故事的魅力

《某科学的超电磁炮》:最强超能力者一方通行的新战斗《某科学的加速器》是一部电视动画,改编自镰池和真和...

《暗影技能第一季》的号召力与评价:格斗动作的巅峰之作

暗影技能 SHADOW SKILL [第 1 季] - 暗影技能 [第 1 季] 详细评论及推荐概述...

电影《角落生物:蓝色月光的魔法孩子》的魅力与评价

电影《角落生物:蓝色月光的魔法之子》的评论和详细信息影片概述电影《角落小朋友:蓝色月夜的魔法孩子》是...

《战斗之歌》评论:《大家的歌》到底有何魅力?

“Fighting Song”——回顾“大家的歌”的杰作《战斗之歌》是一部时长只有两分钟的短篇动画...

没人知道国际空间站该干什么

2024 年,国际空间站将面临关闭。也许吧。这是美国国会在 2014 年设定的任意期限,届时他们将不...

《勇者斗恶龙:比索根与玛索坦》的魅力与评价:独特的世界观和对人物的深入探究

《Hisone and Masotan》:龙与女孩的温馨冒险《勇者斗恶龙:毗曾根与真索旦》是一部于 ...

如何在任何设备上截屏(我们知道你想要)

您可能想要学习如何在计算机或手机上截屏的原因有很多:证明您终于完成了该视频游戏、记录网站布局以便安全...

已灭绝的短鼻鳄拥有巨大的牙齿,可用来咬碎蜗牛

18 年前首次发现的一块头骨化石被证实属于一种已灭绝的泰国短吻鳄新种,名为“蒙恩鳄” ( A. mu...

微型甜甜圈形状的机器人可以在鼻涕中游泳

微生物在世间穿梭并不总是那么容易。细菌和其他在体内蠕动的小生物经常需要在粘稠的环境中前行。对于人类来...

如何将菠菜叶变成人类的心脏

https://www.youtube.com/watch?v=6iUrxGo9gZs菠菜对心脏有...

美国宇航局正在太空启动一项新的量子纠缠实验

美国宇航局本周宣布,将于今年晚些时候在太空启动一项小型量子纠缠实验。这项名为“太空纠缠和退火量子实验...

《格雷戈里恐怖秀》的恐怖与魅力:深度评论

《格雷戈里恐怖秀》:一部将恐怖与幽默融为一体的独特动漫《格雷戈里恐怖秀》是一部电视动画系列,于 19...

是时候将电子游戏加入到你的锻炼计划中了

即使健身房重新开放但人数有限,在家或户外锻炼仍然更安全。因此,我们将今年 9 月命名为“肌肉月”,以...

我的寺庙,我的山

我热爱天文学。我经常思考星星,我更喜欢画它们。这本漫画的第一页由数十亿个小点组成(我的腕管综合症向你...