madison 发表于 2015-9-21 14:48:07

从数据看,进球真的是偶然吗?

      在如今的足球世界,短期化的趋势越来越明显。比如蓝军的一场比赛结束之后,球迷和媒体就迫不及待说法尔考在这一季和去年的表现有多大的不同,甚至还举出5个例子。通常,在谈到一个前锋的时候,都会提到他的自信心,对比赛的饥饿感以及进球欲望。但也有的人认为,球员在球队内部的身体训练和场地训练才是球员们在场上表现有差异的原因。但是,这么多原因中,究竟哪些是真的?哪些是站不住脚的呢?
      
      一起看看下面这幅图,看看这三名球员的表现。这是他们连续6个赛季的进球示意图,那么你觉得他们分别是谁?哪名球员的表现又是最好的呢?
      
      或许读到现在,聪明的你已经发现,这个问题可能是个陷阱。事实上,一定程度上讲,这是同一名球员。这个图表的三个模型使用的是相同的起始环境。图中的18个赛季,这“三名球员”有着相同的射门次数(138次),并且每个人模拟的射门进球率均为14%。

      如果知道了这些,你可以很轻易地发现,图中数据的差别只是随机产生的不同。第一位球员的表现真的是在下滑吗?第二名球员的表现真的比其他球员更稳定吗?

      做出这样的一个模型,很容易让人沾沾自喜。在下面的动图中,我选择了比上图更多的模型,但使用的还是同样的起始条件。
      
      但让人惊讶的是,这么多模型数据中,我们看出,三名球员在这六个赛季的区别并没有想象的那么大。在看这个动图的时候,你或许应该专注于一名球员。或许这么看的时候,你会看到某位球员的表现稳步提升,或许某位球员的表现更稳定,某位球员的表现则显得难以预测。

      如果我们将真实的足球世界中的一些因素加入进来,我们会发现其实我们很多时候都被一些偶然发生的东西所蒙蔽。比如一个球员在一个赛季可以打进25个进球,这很可能是新教练带来的风格更适合他,而如果之后一个赛季他的进球数下降到了10个,那也有可能是场外因素影响了他的发挥。

      在下面的这幅动图中,同样是三名球员,但起始环境有了差别,他们的射门数不同,但每名球员射门的得分率依然是相同的。
      
      打个比方,三名球员的打门次数分别为70次,100次和130次。这意味着这些球员平均每90分钟的射门数差异为1.35次,场均进球数差异则为4.2个(30脚射门*40%=4.2个进球)。

      这样,我们就很容易看出每位球员的差别。但是,我们也更容易看出一些偶然和随机的因素对球员表现的影响有多大。这只是一些数据的模拟,还没有算上现实足球世界必不可少的偶然因素,比如出场时间、伤病、战术等等。很多时候,球员们之间“真正的不同”很容易被一些随机因素所掩盖。

      最后一张动图是之前两张的结合。其中一半的模型有相同的起始条件,但另一半是根据之前的例子制定的。这时你能看出他们分别是哪位球员吗?
      
      在真实世界中,俱乐部不会只根据一些图标模型来判断哪位球员更好。随机和偶然因素是不可避免的,因为现实世界的事情就是如此没有规律,难以预测。但在这个未知的世界,数据分析是固定的,因此,不论是球迷还是媒体,教练还是各支球队,他们都会用数据对球员进行分析。通过创立模型和分析模型下的数字,我们可以判断出哪里的随机趋势最强,这可以让我们快速做出决定,少犯错误,避免了很多盲目的判断。

      比如在今天的例子中,如果我们不只看进球数,而是近距离地观察球员的射门数的话,我们会很容易判断,这些球员们表现的差异会不会在日后重复。我们可以用这些模型和数据来判断哪一位球员更好一些,当然也只是参考。

      对于一些俱乐部来说,他们可以借助这些方法来辅助传统的引援手段,这样可以帮助他们避免在一些平庸的球员身上花过多的转会费,有的时候也能帮助他们发现一些物美价廉的球员。而对于球迷们来说,如果他们了解了这些,就不会急着对一场比赛的结果过早下结论。比如对于现在的阿森纳和切尔西,枪手的表现其实不错(可能只是运气不佳),蓝军的表现或许是真的有问题了。
页: [1]
查看完整版本: 从数据看,进球真的是偶然吗?