持续了一个月的欧洲杯,终于落下帷幕。
北京时间 7 月 12 日(周一)凌晨,本届欧洲杯决赛中,意大利对阵英格兰。两队在 120 分钟时间里 1-1 战平,意大利在欧洲杯中通过点球大战以 3:2击败英格兰夺冠。
意大利上次赢得欧洲杯是 1968 年,2002 年与 2012 年都屈居亚军,今年相隔 53 年再次夺冠,这也让本届延迟了一年的欧洲杯,成为了近期全球共同热议的话题。
早在比赛前几个月里,就有不少研究机构公布了他们对本次大赛的预测结果,各个 AI 综合了近年各个球队的数据、比赛结果和球员表现,对欧洲杯的夺冠热门球队、单场比赛结果,都进行了预测。
现在看来大部分 AI 预测结果,几乎都被打脸。
The Analyst :法国队夺冠希望最大
数据网站 The Analyst 对本届欧洲杯各队的夺冠概率进行了 AI 预测,AI 预测结果显示法国队夺冠概率最高,胜率高达 20.5 %,然而最终法国队却止步于八强。
国家 | AI 预测 夺冠概率 | 实际名次 |
法国 | 20.5% | 16 强 |
比利时 | 15.7% | 8 强 |
西班牙 | 11.3% | 4 强 |
德国 | 9.8% | 16 强 |
葡萄牙 | 9.6% | 16 强 |
意大利 | 7.6% | 冠军 |
荷兰 | 5.9% | 16 强 |
丹麦 | 5.4% | 4 强 |
英格兰 | 5.2% | 亚军 |
从 The Analyst 的 AI 预测结果,对照最终的结果看来,的确差之千里,实际最终夺冠的意大利被认为是第六顺位的夺冠热门,而最终的亚军英格兰队,甚至排在了预测榜的第九名。
高盛:我们觉得冠军是比利时!
高盛公司的预测就更加成熟稳重了,高盛选择在小组赛结束、四强产生后,对模型进行调整,并结合最终结果进行了复盘。
高盛公布的预测维度示意图
高盛首先使用自 1980 年以来 6000 多场国际足球比赛的大型数据集,对每支球队的进球数进行建模(排除掉了友谊赛),将这些数据量化成四个维度来评估球队夺冠概率:
1.球队实力:世界足球 ELO 评级
2.近期势头:近期比赛的进球数和失球数
3.主场优势:主场多 0.4 个进球
4.大赛效应:在大型赛事中的表现优于其他比赛
高盛 AI 预测本届世界杯结果
基于以上数据和维度,高盛的研究人员认为比利时将最终夺冠,而四强分别是:西班牙、比利时、意大利和葡萄牙。
面对最终的现实结果,研究人员也风趣地说道:虽然我们细致地考虑到了比赛的随机性,也预测到结果是高度不确定的。事实证明即使用了复杂的统计技术,足球仍是一种难以预测的比赛。
足球比赛,为什么难以预测?
今年的欧洲杯,似乎大多数预测结果的 AI 都被打脸了。
本届欧洲杯,也出现了荷兰、法国队爆冷提前出局,捷克、英格兰等黑马球队的意外出线,都比赛更加引发关注和热议。
爆冷、黑马、逆转都是体育赛事的看点
除了 The Analyst、高盛,不少机构都参与进了近年体育赛事的结果预测中,通常都融合了传统统计、机器学习的方法。
通常这类赛事预测 AI,会收集近年内全世界千余支球队的数万场比赛的百亿条数据,并将所有能够影响比赛的因素(如球员伤病情况、转会情况、天气情况等)都数据结构化。
再结合博彩公司的盘口和赔率情况,运用机器学习、深度学习等人工智能算法,进行建模,通过分析和匹配得出比赛预测结果。
目前人工智能都是依靠可量化的数据进行观察。但如果数据不真实,结果必然是不准确的。此外,模型无法结合难以量化的因素,例如球队即时状态、球员情绪、现场球迷情绪等等。
数据分析公司美库尔 的总监 Debs Balme 认为,与其他比赛相比,足球比赛的预测本质上更为复杂。足球赛事因为其赛事特性,比赛数量远比篮球、棒球等运动少得多,可利用的数据也更少。比如,棒球运动员一个赛季要打 162 场比赛,而足球联赛一个赛季只有 38 场比赛,再加上杯赛等其他比赛,即使是豪门球队一个赛季也最多比赛 50 多场。所以足球赛事本身的预测难度,就要比其他体育赛事高上很多。
不到最后一刻难定输赢的紧张刺激,和比赛中这些不确定性,也正是足球作为世界最流行、最具观赏性的体育运动的原因之一,也是体育赛事的最大魅力。