iMephisto 发表于 2014-12-31 20:51:00

[翻译团]数读:多特沉沦之谜

[翻译团]数读:多特沉沦之谜由 iMephisto 发表
数读:多特沉沦之谜By Colin Trainor published 12/29/2014
http://i2.hoopchina.com.cn/blogfile/201412/30/BbsImg141990265969184_740*440.jpg
几个月前,我有幸阅读了列纳德-蒙洛迪诺所著的《醉汉的脚步》,其中一句话引起了我的共鸣:
“人类头脑之构造,是要给每一个事件找出确定理由,因而它难以接受无关或随机因素所造成的影响。”
某起事件的结果(在足球中就是比赛的胜负),有时与技艺高超或者能力低下无关,而仅仅是因为“偶然状况”。任意事件,其结果一旦形成,则无法更改。比赛胜负既分,积分榜上的形势就已确定。然而,通过一些分析方法,我们可以对特定结果进行评估,界定其究竟源自于高超技艺,抑或机缘巧合。
进入我视线的是2014版多特蒙德。随着德甲联赛上半程落下帷幕,克洛普的球队出现在积分榜第17位,惹人唏嘘。曾经何时叱咤风云的黄黑军团,仅仅以领先弗赖堡一粒进球的优势,免遭联赛垫底的奇耻大辱。
多特蒙德优势的丧失,是否由于德甲联赛中一大批逼抢凶狠、节奏迅猛球队的涌现?施密特是否已经取代克洛普,成为其他教练竞相效仿和攀比的偶像?在聆听克洛普的球队训话和战术指挥长达七年之后,球员们是否急需另一位舵手的出现?
一切皆有可能。然而,这支2012年的联赛冠军,前两赛季的联赛亚军,2013年的欧冠亚军,当真如此迅速地堕落了?
我希望通过对多特蒙德2014/15赛季上半程的分析回顾,找出其中的答案。
净胜球-8
乍看这一数字,多特蒙德并不像一支面临降级风险的球队。根据我们的进球预期模型,克洛普的球队本赛季大约应当进25球,失17球,预期净胜球为+8。这与球场上的现实情况有着天壤之别,他们共被对手破门26次,进球数则缩减到18——实际净胜球与我们计算出的预期净胜球数之间有着16球的差异。而这一切发生在仅仅17场比赛内。(译注:进球预期,Expected Goals,简称ExpG。主要通过射门位置、射门类型、助攻方式等指标进行计算,得出一次射门最终能够得分的概率。它不会对球场上所有其他球员的位置状态予以考虑,也不会考虑到射门完成后皮球的方向轨迹,主要反映的是射门机会的质量。举例来说,一个在中圈附近的头球攻门,其ExpG值几乎为0,而在小禁区内的一次惯用脚射门,其ExpG值可能会接近于1。对于球队而言,获得的ExpG总值能够显示球队制造和捕捉射门机会的能力;而对于球员个人而言,他的ExpG值更多反映的是其抵达有利射门位置形成射门的能力,而不是其射门技术。这就引出了下文提到的另一个度量,射门后的ExpG值,该数值则会将射门后皮球的飞行轨迹、抵达球门时的落点一并纳入考虑,该数值与原始ExpG值之间的差异就可以用来反映球员本次射门的质量。)
偶尔可能会发生这样一种状况,球队的实际净胜球数低于预期,但却未对其联赛排名造成显著的不利影响。比如说,一支球队有可能发挥出色却仅以一球小胜,或者ExpG模型显示这是一场势均力敌的惜败,实际比分却是一场3到4球的溃败。该两种情况下,与预期净胜球的差距,并不会给联赛积分带来影响。然而不幸的是,多特蒙德本赛季的状况并非如此,他们在六场比赛中以一球之差落败,还取得了三场平局。换而言之,几乎在任何一场比赛中,倘若多出一粒进球,都会给他们带来额外的联赛积分。
通过ExpG模型,我无数次模拟了本赛季德甲联赛中发生的所有射门,得出了这样一张积分榜,这里我只是截取了其中的前五名:
http://i2.hoopchina.com.cn/blogfile/201412/31/BbsImg142002991573358_457*115.jpg

可以看出,除了多特蒙德,其他球队的实际积分都与该模型所预测的积分相差无几。
在模拟积分榜上,多特蒙德不仅没有出现在降级区,甚至出现在联赛第四的位置,与沃尔夫斯堡仅有不到1分的差距。鉴于他们在比赛中获得的射门机会,这些不翼而飞的积分显得格外异常。这种实际进球与预期进球间的巨大差异对我而言同样是闻所未闻,即便他们接下来的表现无甚改善,我也有把握多特蒙德在积分榜上的攀升仅是时间问题。
尽管如此,我还是要对一些度量进行检视,希望找出本赛季的黄黑军团究竟发生了哪些改变。
进球为何如此之少?
多特蒙德之谜吸引我的第一个部分就是他们进球数的缺失。正如前文所述,在ExpG模型中,他们的预期进球数为25,然而事实上他们仅仅18次洞穿对手球门。我很乐意承认我们的模型并非完美,它可能会高估或者低估某些射门的得分概率,但它通常相当准确。这7粒能够极大改善多特蒙德冬歇期前联赛排名的进球到底哪里去了?
除了生成射门瞬间的进球预期值,我们也可以生成射门完成之后的进球预期值。这一度量在很大程度上受到射门最终落点的影响,但同样也会考虑到我们在计算原始ExpG值时所用到的因素(比如,射门位置、射门类型等等)。射门后进球预期值可以用来评估某支球队或者某名球员的射门质量,一记偏出球门或者被封堵的射门,其射门后ExpG值为0(因为它显然无法得分),反之,一粒径直飞向球门上角的皮球,其射门后ExpG值则极高。
根据传统的数据统计,我们仅能看出有多少次射门转化成了进球,那么自然,剩下的射门要么偏出要么被扑救。然而,通过对大量射门数据的射门后ExpG值进行分析,我们能够得到一些额外的信息,为其实际进球数提供合理解释。
在多特蒙德一例中,他们本赛季的射门后ExpG值仅有21,这与射门瞬间显示的原始进球预期值25相去甚远。尽管与实际发生的进球数18仍有一定差距,但是可以看出,是他们的射门质量造成与预期进球值之间的4球之差。
下表列出了所有本赛季射门超过12次的多特蒙德球员。前两列分别显示了每名球员的原始ExpG值和射门后ExpG值,最后一列显示了两者之间的差额,正数表明射门质量较高,负数则表明射门有失水准。
http://i1.hoopchina.com.cn/blogfile/201412/31/BbsImg142003003876260_452*265.jpg

在该度量方面,仅有两名多特蒙德球员表现出色——奥巴梅扬和罗伊斯,其余八名球员的射门全部比预期值造成了更小的威胁。在此需要声明,这些分析都是基于Opta所搜集的极为详尽的触球数据,但是,我无从知晓当时的防守压力,以及射门队员以外的球员位置信息。
姆希塔良和拉莫斯本赛季目前为止的射门表现最是令人失望。姆希塔良射门34次,仅有7次命中门框范围,一球未进(他是联赛中唯一一名射门次数超过21却颗粒无收的球员)。而对于拉莫斯,如果考虑到他是作为莱万多夫斯基的替代者被签入球队,其射门数也是相当惨淡。
因此,我将现实与预期进球数差额之中的4粒归结于他们的射门质量,而另外3粒不翼而飞的进球则归因于对手门将的超常发挥。
通过小样本射门数据(很不幸,半个赛季显示是小样本)分析得来的射手或门将技术评价极易招致非议。进球转化率关系到球队在积分榜上的位置,而在评估一支球队的水平时,制造机会的潜在能力则更为重要,它也更能够预示球队未来的状况。
本赛季多特蒙德的进攻火力并未令人眼前一亮,但是,仅有五支德甲球队制造了比他们更高的总ExpG值。对于球队寥寥无几的破门次数,克洛普有理由感到委屈。
射门机会
多特蒙德的射门次数依然很多,本赛季,仅有拜仁和勒沃库森在射门次数上超过了克洛普的球队。多特蒙德依然延续了过去三个赛季的高射门次数,然而在射门机会质量上,却发生了显著的下滑。与以往两个赛季相比,他们平均每次射门的得分机率有了2%的下降。事实上,在德甲联赛的18支球队中,仅有科隆和帕德博恩在平均射门机会质量这一数值上逊于多特蒙德。
http://i2.hoopchina.com.cn/blogfile/201412/31/BbsImg142003007226413_374*114.jpg

射门机会质量不仅与射门距离有关,射门类型(头还是脚)以及助攻方式也十分重要。然而,在衡量射门机会质量(ExpG值)时,射门距离是一项极其重要的指标,它也非常便于理解。
下表列出了德甲球队在过去两个半赛季中所有非点球射门距离的中值(译注:也就是说,将所有射门发生的距离按大小顺序排成数列,其最中间的数值就是中值。这里使用中值显然更加合理,因为一记后场射门可能就会给平均距离带来极大的影响,却几乎不会影响到中值)。
http://i3.hoopchina.com.cn/blogfile/201412/31/BbsImg14200300945786_382*512.jpg

在2012/13赛季和2013/14赛季,多特蒙德的射门距离中值分别是17.4米和17.9米。而在本赛季,这一数值几近19米。仅从绝对数值意义上看,17.9与18.9之间的差异并不显著,然而考虑到上表中射门距离中值全部集中在一个狭小的范围内浮动,这1米的差异至关重要。
前两个赛季,多特蒙德在射门距离中值上分别位居第4位和第6位。但是,本赛季他们的射门位置更加远离球门,有9支德甲球队的射门距离中值比他们更近。这种射门距离的增加能够很好地帮助我们理解多特蒙德本赛季射门机会质量的下降。
球员个人射门表现
下表显示了最近两个赛季多特蒙德球员的个人射门表现。左侧反映了当前赛季的数字,而右侧反映了上个赛季的相应数值。每一组数据都包括了每名球员的射门次数、平均每次射门的ExpG值,平均每90分钟的ExpG值。
http://i2.hoopchina.com.cn/blogfile/201412/31/BbsImg142003012226437_837*306.jpg

一切豁然开朗,多特蒙德射门机会质量的下降至少部分归因于莱万多夫斯基的出走。波兰人是鲜有的能将大量射门次数与射门机会质量相结合的球员。
尽管球员个人的进球转化率在各个赛季之间关联性不强,然而球员个人单次射门ExpG平均值通常会保持前后一致。也就是说,几乎不可能出现这样一种状况——一位球员上赛季单次射门ExpG平均值为0.10,而下个赛季却变成0.16。每位球员都有自己的个人偏好——占据的位置,跑动习惯,以及在正确时间出现在正确位置的意识。我并不否认存在一些球员突然开窍的个例,但是一般而言,俱乐部如若希望填补一位拥有高射门机会质量的射手留下的空缺,他们必须寻找那些已经证明自己战机捕捉能力的球员。
转会至拜仁后,莱万多夫斯基始终是多特蒙德无法弥补的一处伤痕。拉莫斯贡献了很高的单次射门ExpG平均值,但是他的出场时间不够多,无法带来真正的影响。而多特蒙德2014年夏季转会中签下的另一名射手伊莫比莱,与莱万多夫斯基并非伯仲之间,他在意大利的最后两个赛季中,射门机会质量(ExpG)仅仅介于0.10-0.11。
莱万多夫斯基在队时,球队的最佳射门机会通常都是出现在他的身上。而在莱万离开后,奥巴梅杨没有更进一步,将这些最佳射门机会捕入囊中,他的射门类型并未发生变化。
撇开得到机会时的破门能力不谈,目前的多特蒙德阵中,似乎没有任何人能像莱万那样将球(头顶脚踢)带至危险位置,而这对波兰国家队新任队长而言不过是家常便饭。如果拉莫斯依然无法获得更多的出场时间,那么这是多特蒙德需要着手改善的一个方面。
顺带一提,莱万多夫斯基本赛季在拜仁的单次射门ExpG平均值为0.157。毫无疑问,拜仁所创造的射门机会比其他德甲球队都要出色。然而这再次证明,我们可以相当准确地事先预测一名球员的射门类型。如果我们也能同样轻松地预测他们的射门结果,那该有多好……
多特蒙德的高位压迫
今年早些时候,我创造了一个度量(PPDA,每次防守行为对应的对手传球次数),用以客观衡量一支球队在对手控球时的压迫强度。
简而言之,PPDA给出了对手传球次数与本方在进攻区域实施防守动作数的比率。这一比率越低,说明本方球队在压迫时更具侵略性。之所以创造这一客观度量,是为了帮助我们比较不同球队的压迫强度,以及一支球队在不同时期的压迫强度。
18个月前,在输掉与宿敌拜仁慕尼黑的欧冠决赛后,克洛普如是说道:
“我可以承诺,一切都会迎刃而解。我们在打造一支新的球队,一架全新的压迫机器。”
自从作出该声明之后,多特蒙德的压迫强度不但未有提升,甚至较之此前有所下降。本赛季大量伤病的侵袭也许是原因之一,不过这也是多特蒙德在冬歇期后应当加以改善的一个方面。
http://i3.hoopchina.com.cn/blogfile/201412/31/BbsImg142003014823907_306*116.jpg

上表显示了多特蒙德近三个赛季的PPDA值。本赛季,他们每次成功向持球者施加防守压力之前,平均让对手额外作出了1次传球。这一事实也许会令克洛普感到失望,因为高压迫、快节奏的比赛风格一直被认为是多特蒙德过去几个赛季取得成功的重要因素。
然而,倘若将这些数字放到具体环境中考虑,多特蒙德在压迫方面的表现甚至比PPDA值所显示的还要糟糕。可以看到,上表还包括了多特蒙德在过去三个赛季中比分领先的时间比。
鉴于多特蒙德本赛季的坎坷经历,这一事实也许不会让你感到惊讶,他们在比赛中比分领先的时间仅占25%。这与前两个赛季中的40%和50%颇不相称。
通常,在追赶比分时,球队的压迫会更加猛烈;而在大局已定时,则更加倾向于回收阵型。考虑到这一比赛状况的具体环境,多特蒙德的PPDA值更加令人忧心忡忡。克洛普需要在冬歇期中努力理顺这一点,假设凶猛的压迫依然是他比赛方案的一部分,他必须找出本赛季球队的问题究竟出在何处。
个人层面缺少施压
上述PPDA是用来衡量球队层面的压迫强度。我并不打算在个人层面使用同样的度量,因为尽管我知晓具体防守动作(铲断、拼抢、拦截或者犯规)的实施球员,却无从得知哪些球员位于事件发生的位置周围,当时有可能采取防守动作。为了完成这一分析,我打算深入到球员层面,找出压迫强度下降的根源所在。下表包含了出场时间超过40%的多特蒙德球员,我仅从中挑出了那些活动区域(根据整个赛季的触球位置平均计算)在X轴上大于45的球员(译注:在Opta数据模型中,将球场横置,本方球门线作为Y轴,横向作为X轴,中线在X轴上代表50,而对方球门线在X轴上则代表100)。为了更好地实现我们的分析意图,我希望将防守球员从中剔除。
还有重要的一点需要指出,为了简化分析,我仅仅将发生在对方半场的防守行为纳入统计(基本的PPDA度量则包括所有发生在X>40范围内的传球和防守行为,因此以下数值与总体PPDA数值会有所出入)。
先来看看他们上个赛季的表现(2013/14)。
http://i3.hoopchina.com.cn/blogfile/201412/31/BbsImg142003016538817_418*346.jpg

上表根据球员在X轴上的位置来排列,因此出现在表格上方的球员在球场上的位置更加靠前。莱万多夫斯基在球队最前端的表现相当繁忙,他场均贡献了3.2次的防守行为,而姆希塔良更是极其引人注目,他上个赛季在对方半场贡献了场均4.3次的防守行为。
而本赛季的表现则如下图所示:
http://i3.hoopchina.com.cn/blogfile/201412/31/BbsImg142003017472120_418*347.jpg

拉莫斯良好地融入了多特蒙德的战术体系,他在对方半场贡献了场均3.7次的防守行为,令人印象深刻。遗憾的是,其余球员在高位压迫中的表现令人失望。
出现在球场最前端的伊莫比莱也许最值得注意,他的防守数据相当凄惨,然而意大利人并不是唯一令人失望的。本赛季,大部分球员在前场向对手施加的压力都有所下降,其中包括姆希塔良,他的场均防守行为从4.27下滑到2.40,而奥巴梅扬则从2.57下滑到2.15。
我可以确定这些防守数值的下降并非源自于对手传球次数的增加,因为与上个赛季(285次)相比,对手球队在后场的场均传球次数仅仅发生了1%的变化。
伊杜纳信号公园球场必然有一股暗流涌动,才会削弱了克洛普球队此前最为青睐的高节奏、强压迫体系。本赛季,施密特的勒沃库森以及汉堡都各自提升了球队的高位压迫强度,拜仁慕尼黑则始终维持着他们“高位压迫之王”的宝座,而多特蒙德则不幸地滑向了相反的深渊。
或许是球星的离队令多特蒙德难以承受,或许他们遭受了过多的伤病,然而无论如何,克洛普必须设法改变球队在高位压迫中的颓势,除非他意图改变过去数年中令多特蒙德如鱼得水的战术体系。
防守数据
可悲可叹的是,多特蒙德不仅在ExpG模型中的表现低于预期,他们的防守也同样令人失望。
以下是多特蒙德防守方面的一些不足:
*对手15%的射门转化成了进球(联赛最高)*对手6.3%的禁区外射门转化成了进球,而这一数值的联赛平均水平是3.6%,仅有勒沃库森(7.5%)在该方面的表现比多特蒙德还要逊色。
按照ExpG模型,多特蒙德本赛季的预期失球数应当在16.5左右,然而他们实际上丢了26球。这些额外的进球不应当归于对方前锋的神勇表现,因为根据射门后ExpG模型,对手的进球预期值也仅仅是17.5。简而言之,本赛季克洛普所遣两名门将的发挥不堪回首。
魏登费勒在赛季初作为正选门将,他被对手18次洞穿十指关,而根据射门后ExpG模型,当时球队的失球预期为13.2。魏登费勒因而失宠,朗格拉克于11月底正式上位。遗憾地是,朗格拉克的扑救数据甚至不如魏登费勒,他丢掉了7球,而在射门后ExpG模型中,预期失球仅为4.20。
尽管我们的模型采用射门位置和皮球落点对数据进行了校正,但是在任意指定的射门样本中,门将的扑救依然存在着极大的变数,当然这并不能令克洛普有所宽慰。两个月前,我曾就这一问题进行深入研究(虎扑链接:门将:扑救成功率真的是一项具备再现性的数据吗?),其中发现,如果以75次射正(恰好是多特蒙德门将本赛季面临的射正次数)为一组数据,那么每组数据之间门将的扑救表现几乎毫无相关性。对于球迷而言,这也许难以接受,但是仅仅通过半个赛季的扑救表现来评价一名门将,几乎毫无意义。
小样本的射正数据分析几乎不具备预测功效,也就是说,上半程两名多特蒙德门将的糟糕发挥,极有可能与下半赛季他们面对射门时的表现毫无关联。概率法则告诉我们,哪怕他们再次面临相同的射门,最终的失球数字也肯定会比现在漂亮得多。
结论
基于他们的潜在能力,多特蒙德可以认为自己带着倒数第二的战绩进入冬歇期是某种阴差阳错。哪怕他们下半程的表现与上半赛季如出一辙,也仅有极小的可能在赛季结束时面临降级。
并不是说一切尽善尽美。多特蒙德教练组显然还有许多的工作要做,包括对射门质量下降的矫正,改变缺少施压的状况——这种状况在大部分进攻球员防守行为的减少中可以一目了然。
然而除此之外,还有许多超出球队掌控之外的因素也对多特蒙德的战绩施加了消极影响。比如关键球员的不断伤病,糟糕透顶的扑救成功率,对方门将的超常发挥,队内大牌球员另择良木而栖的意愿也已毕露无遗。
我通过我们的预测算法对2014/15赛季的剩余赛程进行了模拟,生成了这样一张联赛排名概率表:
http://i3.hoopchina.com.cn/blogfile/201412/31/BbsImg142003019428881_330*173.jpg

多特蒙德仅有8%的概率在赛季结束时仍然处于降级区,而获得冠军联赛资格的概率也仅有1%,看起来本赛季剩余部分黄黑军团只能是为尊严而战了。事实上,根据媒体最近的猜测,克洛普是否会继续掌舵多特蒙德剩余的航程依然存疑,他留下的概率似乎比多特蒙德下赛季留在德甲联赛的概率更低。

[ 此帖被iMephisto在2015-01-01 13:11修改 ]

iMephisto 发表于 2014-12-31 20:53:00

接工时间:2014-12-30
完工时间:2014-12-31
接工地址:http://bbs.hupu.com/11416856.html
原文地址:http://statsbomb.com/2014/12/borussia-dortmund-whats-gone-wrong/

wayne19980 发表于 2015-1-1 00:47:00

似乎很厉害的样子=.=

F_fan 发表于 2015-1-1 09:05:00

我横为球队的数据分析作出了不可磨灭的贡献

传球不射门 发表于 2015-1-1 10:17:00

又一年过去了 梅西他娘好好练练射门吧

dogtu 发表于 2015-1-1 10:27:00

太赞了,注册hupu八年看过的最好的文章,mark细读之。

970211 发表于 2015-1-1 10:29:00

看数据看得快晕了。。。

wojowjf 发表于 2015-1-1 10:41:00


http://b1.hoopchina.com.cn/post/smile/icon_scared.gif
这半个赛季的射门水准就是大学野球水平啊。

pavelrandom 发表于 2015-1-1 10:45:00

这才是真正的技术贴,认真慢慢读完了,感觉该回去复习统计学的课本了= =,这样数据化分析球场表现真的很有意思,感谢楼主翻译!

paul_guo 发表于 2015-1-1 10:59:00

简单来说就是门将和前锋两边出了问题?

大帝雄薪 发表于 2015-1-1 11:26:00

进攻组织不力,所以射门位置远离了球门;面对仅有的机会,现有球员射门能力不足,转化率太低;整体防守疲于奔命,压迫不足;每个球员的个人积极性似乎也不够,在球队整体失势时更加的碌碌无为……
我横算是命犯太岁了吧……

火柴点柴火 发表于 2015-1-1 11:34:00

有数据有分析,比单纯的什么射门次数、传威胁球次数、传球准确率要好多了。

本王冷淡 发表于 2015-1-1 11:44:00

作为团蜜,感觉有句话很对。
比如说,一支球队有可能发挥出色却仅以一球小胜,或者ExpG模型显示这是一场势均力敌的惜败,实际比分却是一场3到4球的溃败。
经常有场面相当,我团因为球员能力强,反击犀利,射门转化率高,结果大胜。

polo82 发表于 2015-1-1 11:49:00

这才是真正的多特数据分析贴,而不是胡J8扯。点赞一个。话说我多确实需要买门将了

heaven243 发表于 2015-1-1 12:10:00

四大皆空是必然的,说是为荣誉而战,还不如说是为尊严面战。除非德甲套用美国的NBA规则,干脆摆烂算了
http://b1.hoopchina.com.cn/post/smile/icon_laugh7.gif

reept 发表于 2015-1-1 13:50:00

我想这和德甲整体水平提高有关,另外克洛普的战术是以青春高消耗为代价的,在持续多年以后肯定会下降,时代在变,打法虽好,但也不能一吃到底。巴西传统的足球王国,世界杯上被德国血洗有偶然,但也有必然。

SIMPastor 发表于 2015-1-1 13:53:00

看完了,令人印象深刻。球队无论是攻还是防都出了太大的问题。
唯一有分歧的是其中拉莫斯貌似还能完成莱万的一些任务,在数据上是,但是实际上他现在最水。这些数据只是表现一部分内容。渣叔现在必然亚历山大,这不是5年前出了问题还有大把解决的时间与余地。看新闻说渣叔要去纽卡,这种新闻就是一笑而过,但是如果到了明年夏天风云变幻,那就什么也说不准了。

[ 此帖被SIMPastor在2015-01-01 13:58修改 ]

致远星之秋 发表于 2015-1-1 13:57:00

这贴碉堡了,大赞!

杜塞某男人 发表于 2015-1-1 14:05:00

不错的帖子,ExpG的数据处理方式还是第一次见到,确实令人眼前一亮

浮光跃金 发表于 2015-1-1 14:06:00

真技术贴   点赞
页: [1] 2
查看完整版本: [翻译团]数读:多特沉沦之谜