夏洛特的烦恼 发表于 2016-3-9 18:52:02

Geek讲足球:如何衡量运气与实力在攻防中的作用

      编者按:实力与运气是决定比赛结果的两大因素,那么如何衡量实力和运气在球队的进攻和防守中所占据的比重呢?想必有很多读者会对此有所疑问:这也能够做出相关的数据分析吗?随着数据分析在体育运动中扮演的角色越来越重,这个问题的答案自然是肯定的。以往曾有其他的足球数据分析师对此有所涉猎,而本篇来自statsbomb的文章则在此基础上做了进一步的分析。
      
      在足球这项以射门得分为目标的运动中,运气无疑是一个十分重要的影响因素。目前存在着几种不同的方式来衡量运气在足球运动中的影响比重。比如说PDO指数作为被广泛运用在足球分析领域中的一个指标,主要通过测量一支球队的射正射门直接得分或是被扑救的频率来衡量其表现水平的高低。著名棒球和冰球数据分析师汤姆-坦戈曾对任意一项体育赛事的联赛中各球队的预期偏差程度和实际偏差程度创造了一个测量方式,而这也是本文所使用的主要方式。同时,本文还基于朱利安-瑞恩在《哈佛体育分析》中所阐述的一篇分析文章(译注:在这篇关于橄榄球的分析文章中,他探索了失误对胜率带来的影响,并且将失误分为两类:能力不足导致的和运气不好导致的)。

      要说明的是,大家可以从詹姆斯-格雷森和马丁-伊斯特伍德这两位足球数据分析师此前的文章中找到类似的方式来计算运气对于英超和西甲联赛各球队胜率的影响。他们两人都发现一支球队在整个赛季中凭借自身的实力所能得到的分数占据全部分数的60-65%。我在本文中索要探讨的并非还是胜率的分布情况,而是与得失球数据相关的分布情况,并籍此进一步探索英超联赛中胜率与进球的相关程度。

      【实力所占贡献比重的计算】

      为了得出实力对于球队成绩的影响,我们可以利用下面的公式:

      观测方差=实力方差+运气方差

      (译注:这里的“实力方差”和“运气方差”类比于上文所述朱利安-瑞恩的文章中对于由于能力不足和运气不好而导致的失误的相关统计,只是这里的对象从“失误”变成了“贡献”。同时在本篇译文中,skill这个词用于表示”实力“似乎显得更为合适)

      关于运气方差,我们不妨假设所有球队的赛程都是随机的,因此对于每支球队而言(赛制)都是公平的。另外,很多的研究表明,进球数是服从泊松分布的,因此我们可以按照这种分布来构建关于进球数的数学模型。下面我们就一起看看应该如何推导我们的“运气程度分布”的情况。

      我们都知道,泊松分布中的方差与均值相等。一支英超球队在单赛季的平均进球数为50.2,因此我们不妨假设对于我们所选定的幸运球队而言,其每场比赛的期望进球数为(50.2/38)=1.32球。

      如果xG1表示一支球队在第一场比赛的期望进球数,而xG2代表着其在第二场比赛的进球数,以此类推,同时我们假定每场比赛的期望进球数都是相互独立的,那么我们很容易地就会得出这样一个方差公式:

      Var(xG1 + xG2 + xG3 + …) = Var(xG1) + Var(xG2) + Var(xG3) + …

      由于在我们的“运气程度分布”中,每场比赛的期望进球数都是相同的,同时我们也假定每场比赛都是独立的,因此我们可以将每场比赛的期望进球数进行简单的加和,从而得到这支球队整个赛季的期望进球数方差,即:

      (50.2 / 38)*38=50.2

      这个方差就是我们的运气程度分布的方差。而关于净胜球,我们可以套用这个方差公式,从而得到:

      Var(GF + GA) = Var(GF) + Var(GA)

      (译注:GF为进球数,GA为失球数)

      因此我们的运气程度分布的净胜球数方差可以用此前得到的进球数方差和失球数方差来得到。我们可以以英超积分榜中各球队数据为样本,以方差的定义公式计算出总体的观测方差。综上,实力所占得分比重的计算为:

      实力所占贡献比重=1-(运气程度分布方差/总体观测方差)

      (译注:这里的“实力所占贡献比重”在下文中可以理解为“实力对进球/失球/净胜球数所占的贡献比重”,在下文的翻译中亦用到了“进球/失球/净胜球对于实力的倚重程度”,这两种表述的意义是等同的)

      【得到的结果】

      下面列出的是关于进球数、失球数以及净胜球数的“实力所占贡献比重”的分布情况,样本是过去15个英超赛季的数据。

      
      在每个赛季的更替中,实力贡献比重的数值变动都有着很微妙的意味。平均来看,一支球队的净胜球数多少是最为倚重球队实力的,而失球数多少则跟“运气”关系相对最大。

      不难发现,在上图中实力贡献比重的“最小值”一栏中,单赛季进球数与失球数的分布都显得与球队实力关联很小。然而这并不意味着进球数和失球数这两个指标的变化不依靠实力,因为净胜球数对于球队实力的倚重程度最少也要有74%。

      而在过去的15个英超赛季中,有11个赛季中进球数对于实力的倚重程度要高于失球数,同时只有在阿森纳那个保持不败的2003-04赛季中实力对于进球的贡献比重小于50%。

      我们将全部的300支球队的数据进行了汇总分析,最终得出了一个更好的估计值,即“真实实力贡献比重”(译注:原文作者在这里将不同赛季的同一支球队当作不同的球队来处理)。在汇总之后,我们可以得到下表的结果:
      
      通过上表,不难发现运气对进球数的贡献比重要略微低于25%,对失球数的贡献比重则稍低于1/3,而对净胜球数的贡献比重则只有1/6左右。这就意味着球队在防守中对于自身实力的倚重程度并不如进攻那样,因为球队的失球数相对更多地与运气程度相关。由于在取得进球时实力所占的贡献比重更高,因此我们应该在预测比赛结果的时候更多地考虑到球队的进攻能力。

      我还注意到一点,那就是实力对进球数的贡献比重甚至比起对积分的贡献比重还要高,因此我得出了三个试探性的结论:

      1.比起得到积分,打入进球所包括的运气成分要更少。

      2.泊松分布并非十分完美地契合进球数频率的分布,运气对于期望进球数的方差实际上要比之前我们假设的更高。在两支球队均有进球的比赛中,很明显两支球队的得失球数方差数据在简单的加总之余还需要加上一个协方差的量来计算,故这会对我们得出的结论有些许的影响。当然,我个人还是倾向于认为泊松分布是一个很好的进球数估计模型。

      3.格雷森和伊斯特伍德所得到的实力所占贡献比重显得有点过低了。他们认为他们自己得出的模型有着更低的下界,因为如果考虑到主场优势和其他因素影响,这个比重会相对更高一些。我对自己得出的模型进行了快速的检验,在我的样本中球队的主场胜率为60%,而实力(对主场战绩)所占贡献比重为68%。

      总的来说,比起拥有一个不错的进球数纪录,拥有一个优秀的净胜球成绩会相对更少地包含运气成分,同时它们也都比取得一个漂亮的失球数成绩要相对更少地倚重命运女神的垂青。尽管这与预期相符,但是能够证明并量化此前的直觉判断还是很不错的。

      最后要说的是,我希望在未来能够将这种分析进一步细化,以不同联赛的水平来分类进行分析,籍此来分析实力对进球数的贡献比重是否在低级别联赛中也要比对胜利的贡献比重更高一些。
页: [1]
查看完整版本: Geek讲足球:如何衡量运气与实力在攻防中的作用