“小心三月十五日。”是的,终于又到了一年中的这个时候:大学篮球的皇帝们必须小心谨慎,以免遭到锦标赛垫底的低级种子队的攻击。 3 月 15 日之前,全球数百万人填写了疯狂三月赛事对阵表。2017 年,ESPN 收到了创纪录的 1880 万个对阵表。 获得完美分组的第一步是正确选择第一轮。不幸的是,我们大多数人都无法预测未来。去年,提交的分组中只有 164 个在第一轮中是完美的——不到 0.001%。 当一支低种子球队爆冷击败了热门高种子球队时,许多分组就会被打破。自 1985 年参赛球队扩大到 64 支以来,平均每年至少发生 8 场爆冷。如果你想赢得分组,你最好至少挑选几支爆冷球队。 我们是俄亥俄州立大学的两名数学博士候选人,对数据科学和篮球充满热情。今年,我们决定开发一个计算机程序,使用数学方法预测首轮爆冷,这很有趣。如果我们的预测正确,那么使用我们的程序挑选的球队在第一轮的表现应该会比平均水平更好。 会犯错的人类很难确定首轮哪场比赛会出现爆冷。 假设你必须在 10 号种子和 7 号种子之间做出选择。10 号种子在过去三次锦标赛中都爆冷出局,甚至一度进入四强。7 号种子是一支几乎没有全国报道的球队;普通球迷可能从未听说过他们。你会选择哪一个? 如果你在 2017 年选择 10 号种子,你会选择弗吉尼亚联邦大学而不是加州圣玛丽大学——而你错了。由于一种称为近因偏差的决策谬误,人类可能会被欺骗使用他们最近的观察来做出决定。 近期偏见只是可能影响某人选人过程的一种偏见,但还有很多其他偏见。也许你偏向你的主队,或者你认同某位球员并迫切希望他或她取得成功。所有这些都可能以负面的方式影响你的排名。即使是经验丰富的专业人士也会陷入这些陷阱。 建模失误机器学习可以防范这些陷阱。 在机器学习中,统计学家、数学家和计算机科学家通过让机器“学习”过去的数据来训练机器进行预测。这种方法已用于许多不同的领域,包括营销、医学和体育。 机器学习技术可以比作一个黑匣子。首先,你向算法输入过去的数据,本质上就是在黑匣子上设置刻度盘。一旦设置校准完毕,算法就可以读取新数据,将其与过去的数据进行比较,然后给出预测。 在机器学习中,有各种各样的黑匣子可用。对于我们的疯狂三月项目,我们想要的是分类算法。这些算法帮助我们确定一场比赛是否应该被归类为爆冷,要么提供爆冷的概率,要么明确地将一场比赛归类为爆冷。 我们的程序使用了许多流行的分类算法,包括逻辑回归、随机森林模型和 K 近邻。每种方法就像同一台机器的不同“品牌”;它们在引擎盖下的工作原理就像福特和丰田一样不同,但执行的是相同的分类工作。每种算法或盒子都有自己对发生意外的概率的预测。 我们利用 2001 年至 2017 年所有首轮球队的统计数据来设置我们的黑匣子。当我们用 2017 年首轮数据测试我们的一种算法时,它的成功率约为 75%。这让我们有信心,分析过去的数据,而不是仅仅相信我们的直觉,可以更准确地预测爆冷,从而得到更好的整体排名。 爆冷的可能性对于 2018 年疯狂三月,三种机器学习模型试图预测第一轮是否会出现爆冷。百分比是比赛中排名较低的球队击败排名较高的球队的概率。
模型 A:逻辑回归异常概率 图表:Matthew Osborne 和 Kevin Nowland,《对话》,CC-BY-ND获取数据 这些盒子与人类直觉相比有什么优势?首先,机器可以在几秒钟内识别出 2001-2017 年所有数据中的模式。更重要的是,由于机器只依赖数据,它们可能不太可能受到人类心理偏见的影响。 这并不是说机器学习会给我们提供完美的分组。尽管分组可以避免人类偏见,但它并不能免于错误。结果取决于过去的数据。例如,如果一号种子在第一轮输了,我们的模型不太可能预测到, (编者注:哈哈) 此外,机器学习算法在处理数千甚至数百万个示例时效果最佳。自 2001 年以来,疯狂三月第一轮比赛仅进行了 544 场,因此我们的算法不会正确预测每场冷门。正如篮球专家 Jalen Rose 所说,我们的输出应与您的专业知识(以及运气)结合使用,以选择正确的比赛。 机器学习疯狂?我们不是第一批将机器学习应用于疯狂三月的人,也不会是最后一批。事实上,机器学习技术可能很快就会成为让你的比赛更具竞争力的必需品。 您不需要数学学位即可使用机器学习——尽管它对我们有帮助。很快,机器学习可能比以往任何时候都更容易获得。有兴趣的人可以在线查看我们的模型。请随意探索我们的算法,甚至自己想出更好的方法。 马修·奥斯本 (Matthew Osborne) 是数学博士候选人,凯文·诺兰 (Kevin Nowland) 是俄亥俄州立大学数学博士候选人。本文最初发表于 The Conversation。 |
人类的饮食习惯往往会带来毁灭性的后果。没有哪个物种像大西洋鳕鱼一样,能体现出人类食欲的破坏力。20 ...
当你最终决定安定下来并弄清楚如何卷烟时,它看起来似乎很简单——直到你尝试并意识到它比你想象的要复杂得...
Adam Harley 的卷积神经网络 3D 可视化让您了解人工智能的内部工作原理。截图/ Adam...
电子游戏机的发布并不像典型的电子产品发布那样——它们以慢动作进行。我们在一年多前就听说了索尼新款 P...
“天地无用!GXP”——一场宿命般的冒险与宇宙的扩张《天地无用!GXP》是一部电视动画系列,于 20...
在人眼看来,一段仿真狐狸视频可能看起来像是动画电影中的角色。然而,对于一只孤儿幼年红狐狸(称为幼狐)...
硅谷亿万富翁支持的将 6 万英亩土地改造成乌托邦式“昨日之城”的计划正式被推迟了至少两年。加州永恒组...
最近,我注意到一段视频,视频中一只螳螂正在攻击一只蜂鸟。“等等,”我想,“螳螂能抓蜂鸟吗?”这对我来...
1896 年,瑞典物理学家兼化学家斯万特·阿伦尼乌斯预测,地球大气中二氧化碳的增加将导致气温升高。五...
今天是 2023 年奥运会电子竞技系列赛 (OES) 的正式开始,网球、赛车、射箭、棒球、跆拳道、自...
本文已更新。最初于 2019 年 4 月 28 日发布。我们的笔记本电脑和智能手机具有很大的吸引力。...
9 月初的几天里,整个西部都像被烧毁了一样。落基山脉西坡吹来的异常强风助长了数十起新的野火,从华盛顿...
Oyoneko Boonyan - 回顾怀旧喜剧动漫20世纪80年代,日本动画界涌现出许多杰作,其中...
如果有人承诺等待一段时间后会给你更美味的东西,你会把饼干含在嘴里一分钟而不吃吗?大多数动物都无法控制...
希拉毒蜥是一种奇怪的蜥蜴,无论从物理还是化学角度看都是如此。大多数人至少可以认出这种 1.5 英尺长...