人工智能可以帮助预测疯狂三月的冷门,但它远非完美

人工智能可以帮助预测疯狂三月的冷门,但它远非完美

“小心三月十五日。”是的,终于又到了一年中的这个时候:大学篮球的皇帝们必须小心谨慎,以免遭到锦标赛垫底的低级种子队的攻击。

3 月 15 日之前,全球数百万人填写了疯狂三月赛事对阵表。2017 年,ESPN 收到了创纪录的 1880 万个对阵表。

获得完美分组的第一步是正确选择第一轮。不幸的是,我们大多数人都无法预测未来。去年,提交的分组中只有 164 个在第一轮中是完美的——不到 0.001%。

当一支低种子球队爆冷击败了热门高种子球队时,许多分组就会被打破。自 1985 年参赛球队扩大到 64 支以来,平均每年至少发生 8 场爆冷。如果你想赢得分组,你最好至少挑选几支爆冷球队。

我们是俄亥俄州立大学的两名数学博士候选人,对数据科学和篮球充满热情。今年,我们决定开发一个计算机程序,使用数学方法预测首轮爆冷,这很有趣。如果我们的预测正确,那么使用我们的程序挑选的球队在第一轮的表现应该会比平均水平更好。

会犯错的人类

很难确定首轮哪场比赛会出现爆冷。

假设你必须在 10 号种子和 7 号种子之间做出选择。10 号种子在过去三次锦标赛中都爆冷出局,甚至一度进入四强。7 号种子是一支几乎没有全国报道的球队;普通球迷可能从未听说过他们。你会选择哪一个?

如果你在 2017 年选择 10 号种子,你会选择弗吉尼亚联邦大学而不是加州圣玛丽大学——而你错了。由于一种称为近因偏差的决策谬误,人类可能会被欺骗使用他们最近的观察来做出决定。

近期偏见只是可能影响某人选人过程的一种偏见,但还有很多其他偏见。也许你偏向你的主队,或者你认同某位球员并迫切希望他或她取得成功。所有这些都可能以负面的方式影响你的排名。即使是经验丰富的专业人士也会陷入这些陷阱。

建模失误

机器学习可以防范这些陷阱。

在机器学习中,统计学家、数学家和计算机科学家通过让机器“学习”过去的数据来训练机器进行预测。这种方法已用于许多不同的领域,包括营销、医学和体育。

机器学习技术可以比作一个黑匣子。首先,你向算法输入过去的数据,本质上就是在黑匣子上设置刻度盘。一旦设置校准完毕,算法就可以读取新数据,将其与过去的数据进行比较,然后给出预测。

机器学习算法的黑盒视图。Matthew Osborne,CC BY-SA

在机器学习中,有各种各样的黑匣子可用。对于我们的疯狂三月项目,我们想要的是分类算法。这些算法帮助我们确定一场比赛是否应该被归类为爆冷,要么提供爆冷的概率,要么明确地将一场比赛归类为爆冷。

我们的程序使用了许多流行的分类算法,包括逻辑回归、随机森林模型和 K 近邻。每种方法就像同一台机器的不同“品牌”;它们在引擎盖下的工作原理就像福特和丰田一样不同,但执行的是相同的分类工作。每种算法或盒子都有自己对发生意外的概率的预测。

我们利用 2001 年至 2017 年所有首轮球队的统计数据来设置我们的黑匣子。当我们用 2017 年首轮数据测试我们的一种算法时,它的成功率约为 75%。这让我们有信心,分析过去的数据,而不是仅仅相信我们的直觉,可以更准确地预测爆冷,从而得到更好的整体排名。

爆冷的可能性

对于 2018 年疯狂三月,三种机器学习模型试图预测第一轮是否会出现爆冷。百分比是比赛中排名较低的球队击败排名较高的球队的概率。

种子队对阵更高种子下种子模型 A模型 B C 型实际比赛结果
# 1 对比 # 16弗吉尼亚州马里兰大学巴尔的摩分校2.81% 10%不是心烦意乱沮丧的
#8 对比 #9克赖顿堪萨斯州立大学30.69% 10%不是心烦意乱不是心烦意乱
#5 对比 #12肯塔基州戴维森26.07% 60%沮丧的没什么不开心
#4 对比 #13亚利桑那水牛23.46% 60%不是心烦意乱沮丧的
#6 对比 #11迈阿密(佛罗里达州)芝加哥洛约拉大学31.65% 10%不是心烦意乱沮丧的
#3 对比 #14田纳西州莱特州立大学11.03% 0%不是心烦意乱不是心烦意乱
#7 对比 #10内华达州德克萨斯州40.76% 70%不是心烦意乱没什么不开心
#2 对比 #15辛辛那提佐治亚州立大学9.96% 50%不是心烦意乱不是心烦意乱
# 1 对比 # 16泽维尔德克萨斯南方大学8.17% 0%不是心烦意乱不是心烦意乱
#8 对比 #9密苏里州佛罗里达州立大学56.17% 40%沮丧的沮丧的
#5 对比 #12俄亥俄州立大学南达科他州17.86% 10%沮丧的不是心烦意乱
#4 对比 #13冈萨加北卡罗来纳大学格林斯伯勒分校11.91% 40%不是心烦意乱没什么不开心
#6 对比 #11休斯顿圣地亚哥州立大学33.6% 50%沮丧的不是心烦意乱
#3 对比 #14密歇根州蒙大拿4.91% 20%不是心烦意乱不是心烦意乱
#7 对比 #10德克萨斯 A&M普罗维登斯42.96% 10%不是心烦意乱不是心烦意乱
#2 对比 #15北卡罗来纳大学利普斯科姆6.38% 10%不是心烦意乱不是心烦意乱
# 1 对比 # 16维拉诺瓦大学拉德福德2.58% 40%不是心烦意乱不是心烦意乱
#8 对比 #9弗吉尼亚理工大学阿拉巴马州42.82% 40%沮丧的沮丧的
#5 对比 #12西弗吉尼亚大学默里州立大学9.88% 10%不是心烦意乱不是心烦意乱
#4 对比 #13威奇托州立大学马歇尔18.59% 20%不是心烦意乱沮丧的
#6 对比 #11佛罗里达圣文德14.53% 40%不是心烦意乱不是心烦意乱
#3 对比 #14德克萨斯理工大学斯蒂芬·F·奥斯汀7.97% 0%不是心烦意乱不是心烦意乱
#7 对比 #10阿肯色州巴特勒33.29% 20%不是心烦意乱沮丧的
#2 对比 #15普渡大学加州州立大学富勒顿分校4.07% 0%不是心烦意乱没什么不开心
# 1 对比 # 16堪萨斯州宾夕法尼亚大学5.91% 0%没什么不开心不是心烦意乱
#8 对比 #9西顿霍尔北卡罗来纳州立大学36.80% 40%没什么不开心不是心烦意乱
#5 对比 #12克莱姆森新墨西哥州22.93% 40%不是心烦意乱不是心烦意乱
#4 对比 #13奥本查尔斯顿16.51% 30%没什么不开心不是心烦意乱
#6 对比 #11交通控制单元锡拉丘兹28.83% 10%不是心烦意乱沮丧的
#3 对比 #14密歇根州立大学巴克内尔7.39% 20%没什么不开心不是心烦意乱
#7 对比 #10罗德岛俄克拉荷马州59% 40%沮丧的不是心烦意乱
#2 对比 #15公爵艾奥纳岛5.35% 10%不是心烦意乱不是心烦意乱

模型 A:逻辑回归异常概率
模型 B:随机森林扰乱概率
模型 C:K 近邻分类

图表:Matthew Osborne 和 Kevin Nowland,《对话》,CC-BY-ND获取数据

这些盒子与人类直觉相比有什么优势?首先,机器可以在几秒钟内识别出 2001-2017 年所有数据中的模式。更重要的是,由于机器只依赖数据,它们可能不太可能受到人类心理偏见的影响。

这并不是说机器学习会给我们提供完美的分组。尽管分组可以避免人类偏见,但它并不能免于错误。结果取决于过去的数据。例如,如果一号种子在第一轮输了,我们的模型不太可能预测到,因为这种事以前从未发生过

(编者注:哈哈)

此外,机器学习算法在处理数千甚至数百万个示例时效果最佳。自 2001 年以来,疯狂三月第一轮比赛仅进行了 544 场,因此我们的算法不会正确预测每场冷门。正如篮球专家 Jalen Rose 所说,我们的输出应与您的专业知识(以及运气)结合使用,以选择正确的比赛。

机器学习疯狂?

我们不是第一批将机器学习应用于疯狂三月的人,也不会是最后一批。事实上,机器学习技术可能很快就会成为让你的比赛更具竞争力的必需品。

您不需要数学学位即可使用机器学习——尽管它对我们有帮助。很快,机器学习可能比以往任何时候都更容易获得。有兴趣的人可以在线查看我们的模型。请随意探索我们的算法,甚至自己想出更好的方法。

马修·奥斯本 (Matthew Osborne) 是数学博士候选人,凯文·诺兰 (Kevin Nowland) 是俄亥俄州立大学数学博士候选人。本文最初发表于 The Conversation。

<<:  摄影爱好者的 iPhone 8 Plus 相机指南

>>:  Breslin——管理我家的家用电脑

推荐阅读

黑色四叶草的魅力与评价:彻底解读魔法世界的冒险

黑色四叶草:魔法与友谊的故事《黑色四叶草》是改编自田畑佑希创作的人气漫画的电视动画。该剧于2017年...

用这款简易 DIY 猫抓柱让你的猫主人开心

这些建筑材料是猫认可的 Sarah Fecht多年来,我花了很多钱购买猫咪配饰,但最后发现都是垃圾。...

《Love Live!Sunshine!》第一集的印象与评论

《Love Live!Sunshine!》详细评论及推荐系列电视 #1概述“爱生活!阳光!!”是一部...

大众 XL1 是有史以来最节能的汽车

多年来,汽车制造商一直致力于将燃油经济性提高到每加仑 100 英里以上。达到这一目标通常意味着三件事...

不要满足于更少:以 119.97 美元的价格购买 Microsoft Office 2024

厌倦了笨重的软件,让生产力感觉像是一件苦差事?Microsoft Office 2024 Home ...

《Manga Nippon Mukashibanashi》[第 2 辑] 的魅力与评论:重新发现日本古老的美好故事

《漫画日本昔日花絮 [第二辑]》的魅力与评价Manga Nippon Mukashi Banashi...

彻底解析电影《金色马赛克:谢谢!》的情感与魅力

电影《金色马赛克》的魅力和评价谢谢!!金色马赛克:谢谢!!该剧场版于 2021 年 8 月 20 日...

新研究发现,每个人类精液样本都含有微塑料

上个月有消息称,人类睾丸中很容易检测到微塑料,这似乎还不够糟糕,一项新研究进一步证实了这一令人不安的...

新发现的红矮星储量使宇宙中已知恒星的数量增加了三倍

今天,在《自然》杂志上发表的一篇论文中,耶鲁大学和哈佛大学的天文学家发现了八个邻近星系中存在一群小红...

兵库叔叔——全面回顾感人的故事和人物的深度

来自兵库县的叔叔 - 兵库之王子山■ 公共媒体卵子■ 原创媒体动漫原创■ 发布日期2008 年 4 ...

《决斗大师胜利 V3》评论:该系列第 10 部作品的吸引力何在?

《决斗大师胜利V3》的吸引力与评价《决斗大师胜利V3》是2013年4月6日至2014年3月30日在...

地球可能曾经有过两个卫星,它们相撞形成了我们所知的卫星

数十亿年前,一颗原始的第二颗卫星可能撞击了我们现有的卫星,其残骸压在了其较大的卫星上,并破坏了较大卫...

一份包装好的可食用礼物可延长性生活时间(对蜘蛛而言)

带着礼物而来的人会花更多时间与女士们相处,至少在蜘蛛的世界里是如此。 兴奋的蛛形纲动物会记得带上一份...

《学园美男》的魅力与评价:这部青春校园剧到底有何新魅力?

学园帅哥 - 学园帅哥 - 综合评论及推荐概述《学园美男》是2016年播出的电视动画系列,是一部根据...

通过这款应用学习一门新语言,这样我就可以去旅行了

多年来,世界一直在呼唤我,而我最终将通过游历欧洲甚至可能移居欧洲来回应。羡慕吗?加入我吧。我正在通过...