NCAA男子篮球锦标赛的赛程可以通过数学来帮助 - 彭博社
Eric Chemi
2013年4月8日在亚特兰大的NCAA男子锦标赛决赛摄影:David E. Klutho/Sports Illustrated通过Getty Images令人惊讶的是(也许有点令人不安),有多少脑力被投入到填写NCAA男子篮球锦标赛的赛程中。我最近查看了数据科学家如何开发预测分析来选择获胜的大学球队,因为三月疯狂即将开始。
然后是Ed Feng,Power Rank的创始人。他的产品是一种新颖的数学方法,将球队相互排名,然后将这些排名转换为准确的胜率。Feng拥有出色的量化技能——斯坦福大学化学工程博士,研究领域为统计物理。他的方法采用的数学与PageRank算法相似,该算法因谷歌而闻名。
Feng将他的排名系统应用于足球、篮球、冰球、棒球和足球。对于大学篮球,他对所有351支球队进行从高到低的排名,计算基于球队的结果:他们击败了谁,输给了谁,以及输的分数。每支球队的对手也会进行相同的计算,从而创建一个所有球队相互对抗的完整网络。
每个球队的数值评分是其在中立场地对抗平均球队的预测胜利幅度。这使得每个数字都很简单易用——你只需相减,两队之间的差值就是预期的胜利幅度。例如,冯的排名第一的球队是亚利桑那野猫队,得分为17.96。他将俄勒冈队排在第21位,得分为12.4。如果这两支球队相遇,他会将优势给予亚利桑那,预期胜利幅度为5.56分。
这个预期的胜利幅度可以转化为胜利概率。例如,一分的差距相当于53%的胜利概率。更大的分差对应更高的胜利概率:五分的差距是65%,十分的差距是77%。因此,在我们的亚利桑那-俄勒冈比赛中,5.56分的差距将转化为亚利桑那超过65%的胜利概率。
根据初步的赛程,冯的网站已经为每场比赛提供了 概率预测。他对赢得你的赛程的最简单建议是:“不要参与大型池子。”如果你在一个少于10人的池子中竞争,冯建议你每次都选择胜率更高的球队。他表示,10到50名参赛者的池子仍然给你一个不错的获胜机会,但超过100名参与者的池子“太随机”,希望不大。
在他的预测中,冯忽略了地区种子或投票排名,而依赖于他的力量排名方法。他建议,选择最终获胜者的最佳策略是找到一支胜率高但并非所有人都在选择的球队:一个“被低估的冠军”。今年他认为那支球队是路易斯维尔,他给了红雀队7%的获胜机会。他指出,胜率最高的球队往往被公众高估,因此他采取稍微对立的策略。
因为最终的冠军需要连续赢得六场比赛,冯正在尝试寻找表现稳定的球队。他考虑的因素之一是效率的方差:例如,大卫森学院在一致性方面是最不稳定的球队,因此它在会议锦标赛中失利也就不足为奇了。大卫森可能太冒险,不适合被选为有深度表现的球队。
冯关注的另一个因素是三分球投篮。他认为一支在10到12场比赛中表现火热、三分球命中率比赛季平均水平高出3%到4%的球队,应该会有所回归。他建议早期对这种球队进行反向投注,因此他完全预期内布拉斯加将在首轮中失利。
尽管冯知道很多,但仍有很多他尚未能够弄明白的事情。例如,他想知道是否有可能掌握“量化团队化学”的方法。他坚信,仅靠数字无法给出所有答案,因为运气和人性因素在投注时仍然会显现出来。
至于冯自己的个人预测,他说他的朋友们太聪明,不会让他参加他们的竞猜。