我本质上是一个反惟数据论者,但是最近whoscored的数据看的比较多,觉得rating并不是大家所普遍认为的那么没有意义。whoscored的rating算法的公式我无从得知,所以只能简单谈谈看法。
1,大体上来上,whoscored的赛后评分由于是机打,所以最大的特点就是客观。由于数据收集的较完整,并且撇除了主观因素,所以即使某场的rating可能与球迷心中的rating相比有偏差,但是个人觉得客观性还是比较高的,尤其是从赛季平均rating来看。
2,打分的目的就是用来比较,机打的最大优点是把比较的双方放在了同一个打分体系下,所以合适的比较应该是同位置的比较。来看看这个:大舅哥rating是英超第一(不限定出场时间)
http://i1.hoopchina.com.cn/blogfile/201503/06/BbsImg142561946168464_681*428.png
再看这场比赛Green VS 大舅哥
http://i2.hoopchina.com.cn/blogfile/201503/06/BbsImg142561978594967_1012*446.png
这场比赛Green面临的考验本就比大舅哥大的多,凭着7比2的扑救数,rating比大舅哥高并不过分吧?
3,诚然,whoscored的数据在不同位置的比较上确实有点不准确,比如大舅哥的rating居然全队最低。但是我们换个角度,难道球迷自己评的不同位置比较就准确了?先不说黑蜜,前场球员的表现机会本就比后场球员多,你们不觉得Gibbs可以拿最佳,也总会有觉得Gibbs配上的最佳的球迷。
再上个whoscored评分,比较球迷中常见的争议。这是不是比厂蜜们公允多了?
http://i2.hoopchina.com.cn/blogfile/201503/06/BbsImg142562012551044_673*706.png
忘记引用了@stankvoic
不能赞同更多。
http://b1.hoopchina.com.cn/post/smile/5.gif
引用18楼 @hufrankhp 发表的:
我本质上是一个反惟数据论者,但是最近whoscored的数据看的比较多,觉得rating并不是大家所普遍认为的那么没有意义。whoscored的rating算法的公式我无从得知,所以只能简单谈谈看法。
1,大体上来上,whoscored的赛后评分由于是机打,所以最大的特点就是客观。由于数据收集的较完整,并且撇除了主观因素,所以即使某场的rating可能与球迷心中的rating相比有偏差,但是个人觉得客观性还是比较高的,尤其是从赛季平均rating来看。
2,打分的目的就是用来比较,机打的最大优点是把比较的双方放在了同一个打分体系下,所以合适的比较应该是同位置的比较。来看看这个:大舅哥rating是英超第一(不限定出场时间)
http://i1.hoopchina.com.cn/blogfile/201503/06/BbsImg142561946168464_681*428.png
再看这场比赛Green VS 大舅哥
http://i2.hoopchina.com.cn/blogfile/201503/06/BbsImg142561978594967_1012*446.png
这场比赛Green面临的考验本就比大舅哥大的多,凭着7比2的扑救数,rating比大舅哥高并不过分吧?
3,诚然,whoscored的数据在不同位置的比较上确实有点不准确,比如大舅哥的rating居然全队最低。但是我们换个角度,难道球迷自己评的不同位置比较就准确了?先不说黑蜜,前场球员的表现机会本就比后场球员多,你们不觉得Gibbs可以拿最佳,也总会有觉得Gibbs配上的最佳的球迷。
再上个whoscored评分,比较球迷中常见的争议。这是不是比厂蜜们公允多了?
http://i2.hoopchina.com.cn/blogfile/201503/06/BbsImg142562012551044_673*706.png
忘记引用了@stankvoic
当然谁也没必要一棍子把数据打死,按whoscored介个嘛对我厂评分那就客观多了。但不知道这个评分有没完全版本,比如纵向维度标题?样本是包含本赛季足总杯还是仅仅是联赛呢?仅仅几场比赛那也客观不起来哦,还得看上场数场次等等,运用数据是个大学问,运用人主观框定的边界不一样,产生的结果和判定那可能就大相径庭了。比如一个球员三四个赛季一坨屎,就中间一个赛季好一点。说他优秀的人自然把1个赛季数据拎出来当然没错,但说他平庸的人就会把4个赛季打包呈现。你说到底此人平庸呢还是优秀呢。更不用说还有skysports等等五花八门的数据提供者还数据打架,如果仅仅是个普通球迷,纯数据这种东西,没数学基础的不要玩,足球是个很复杂的系统,就像围棋个中变化千奇百怪,电脑深蓝可以存储各种定式搞定国际象棋大师,但目前没一台电脑通过数据储备可以下过稍有个四五级水平的小孩子的道理一样。 引用18楼 @hufrankhp 发表的:
我本质上是一个反惟数据论者,但是最近whoscored的数据看的比较多,觉得rating并不是大家所普遍认为的那么没有意义。whoscored的rating算法的公式我无从得知,所以只能简单谈谈看法。
1,大体上来上,whoscored的赛后评分由于是机打,所以最大的特点就是客观。由于数据收集的较完整,并且撇除了主观因素,所以即使某场的rating可能与球迷心中的rating相比有偏差,但是个人觉得客观性还是比较高的,尤其是从赛季平均rating来看。
2,打分的目的就是用来比较,机打的最大优点是把比较的双方放在了同一个打分体系下,所以合适的比较应该是同位置的比较。来看看这个:大舅哥rating是英超第一(不限定出场时间)
http://i1.hoopchina.com.cn/blogfile/201503/06/BbsImg142561946168464_681*428.png
再看这场比赛Green VS 大舅哥
http://i2.hoopchina.com.cn/blogfile/201503/06/BbsImg142561978594967_1012*446.png
这场比赛Green面临的考验本就比大舅哥大的多,凭着7比2的扑救数,rating比大舅哥高并不过分吧?
3,诚然,whoscored的数据在不同位置的比较上确实有点不准确,比如大舅哥的rating居然全队最低。但是我们换个角度,难道球迷自己评的不同位置比较就准确了?先不说黑蜜,前场球员的表现机会本就比后场球员多,你们不觉得Gibbs可以拿最佳,也总会有觉得Gibbs配上的最佳的球迷。
再上个whoscored评分,比较球迷中常见的争议。这是不是比厂蜜们公允多了?
http://i2.hoopchina.com.cn/blogfile/201503/06/BbsImg142562012551044_673*706.png
忘记引用了@stankvoic
我擦,这个平均评分还真的挺客观的,没什么大的槽点。 引用19楼 @王者回归吗 发表的:
恩,有道理啊,首先就是要“撇除主观看法”,尽量公允。。。。
http://b1.hoopchina.com.cn/post/smile/5.gif
引用20楼 @塞斯克诺兰 发表的:
不能赞同更多。
http://b1.hoopchina.com.cn/post/smile/5.gif
两位在厂区数据分析上都是我的前辈,有很多需要向你们学习的。
话说无论是W站还是S站,都没有跑动数据,请问如果要查询跑动数据,该去哪里查? 引用23楼 @hufrankhp 发表的:
两位在厂区数据分析上都是我的前辈,有很多需要向你们学习的。
话说无论是W站还是S站,都没有跑动数据,请问如果要查询跑动数据,该去哪里查?
这个得诺兰回答你,我也就是个贴图党的水平。。。。
http://b1.hoopchina.com.cn/post/smile/icon_laugh7.gif
引用23楼 @hufrankhp 发表的:
两位在厂区数据分析上都是我的前辈,有很多需要向你们学习的。
话说无论是W站还是S站,都没有跑动数据,请问如果要查询跑动数据,该去哪里查?
哪里,谬赞了。我对数据统计分析也不在行。
跑动数据OPTA上有吧,但是要付费。就这几个免费网站WS,SQ,442,都没有,WS倒是出了个跑位热点图。
咱们普通球迷比较难获取。
@ Rustybash 对数据统计在行,或者有更好的建议。 引用21楼 @上善厄齐尔 发表的:
当然谁也没必要一棍子把数据打死,按whoscored介个嘛对我厂评分那就客观多了。但不知道这个评分有没完全版本,比如纵向维度标题?样本是包含本赛季足总杯还是仅仅是联赛呢?仅仅几场比赛那也客观不起来哦,还得看上场数场次等等,运用数据是个大学问,运用人主观框定的边界不一样,产生的结果和判定那可能就大相径庭了。比如一个球员三四个赛季一坨屎,就中间一个赛季好一点。说他优秀的人自然把1个赛季数据拎出来当然没错,但说他平庸的人就会把4个赛季打包呈现。你说到底此人平庸呢还是优秀呢。更不用说还有skysports等等五花八门的数据提供者还数据打架,如果仅仅是个普通球迷,纯数据这种东西,没数学基础的不要玩,足球是个很复杂的系统,就像围棋个中变化千奇百怪,电脑深蓝可以存储各种定式搞定国际象棋大师,但目前没一台电脑通过数据储备可以下过稍有个四五级水平的小孩子的道理一样。
这个话题太大了。
你说的有道理,数据确实不是万能的,所以说我也是反数据惟一论者。但是我个人还是认为你举的例子与我对W站数据的理解有一些不同,有一部分缺陷是W站带来的,有一部分是体育数据分析这种方法本身带来的,两者最好不要混淆。
就拿我之前贴的,我厂球员本赛季rating的例子来看。虽然打分的逻辑我们得不到(黑箱),我也确信打分的公式一定不够精确,但是从结果来看,他确实比绝大部分厂区的球迷客观专业。第一他是有时间纬度的,看的就是我厂球员这个赛季的表现,你要看更长时间或者某几场,也是可行的。第二rating是基于事实数据得来的,对于厂区较大的几个争议,rating的观点基本符合主流观点,比如拉姆西小威胁的rating,比如272的rating,又比如M4 vs K6/P5,3C vs 大舅哥。
如果某些数据带来的结论不符合我们的预期,我们可以讨论这些数据的算法是不是不科学,可以有不同的解读,但是基础数据本身是不带立场,不会说谎的。 引用25楼 @塞斯克诺兰 发表的:
哪里,谬赞了。我对数据统计分析也不在行。
跑动数据OPTA上有吧,但是要付费。就这几个免费网站WS,SQ,442,都没有,WS倒是出了个跑位热点图。
咱们普通球迷比较难获取。
@ Rustybash 对数据统计在行,或者有更好的建议。
Rustybash确实是厂区大神:P
其实我也就是业务爱好,厂区和别人吵架的时候贴贴数据自证一下观点。。。数据分析坑太深了 引用6楼 @上善厄齐尔 发表的:
刚刚结束的和女王的比赛。评分得出的结果吉布斯是全场最佳,看过直播或者录像的人都会傻眼吧。
唯数据论者就会盲从把他加入到自己的论据当中。所以数据、录像、截图回顾等等都是一种分析手段而已,关键是在这个手段后面的看球的人怎么运用了。
http://i1.hoopchina.com.cn/blogfile/201503/06/BbsImg142560861444010_500*357.jpg
吉布斯两个助攻,最佳也许说不上,单凭表现高分是肯定该有的,至少高分说明他的插上有效率,跑位合理。
上一场厄祖也是同样状况,一群黑子骂他隐身同时,他两个助攻,大家觉得厉害,这回换到大英球员,马上就是质疑。别故作客观,明眼人看得出来是什么意思。 个人觉得阿森纳表现是很好
但温格的踢法是让运气尽可能远离自己的踢法 , 全体压上,老是被打反击 ,复杂容错性低;
而穆里尼奥 和瓜迪奥拉的踢法就是能获得运气的踢法, 先追求立于不败之地,再抓对手失误,以及通过控制压迫让对手出现失误, 实在没机会就依靠远射和个人突破碰下运气
温格总是限制队员起脚, 总是等全体压上了再往禁区内发展, 这时对手已摆好铁阵,自己失误就是给对手机会 ws方兴未艾之际(大约是12年初),由于翻译和浏览了不少该站的文,我发现除却进球助攻威胁球这明眼人都能理解的刷分三神器之外,其中off项的“过人”(成功率与次数)def项的“解围”(绝对次数)和“铲断”(成功率和次数)在分值中所占比重极大,尤其是突破过人…因此过人如麻者如门兴拉斐尔(当年还在)格拉纳达的布拉西米之流分值都刷得很嗨(遑论煤球王了),而红军铁卫斯科特则凭借英超第一的清球数刷成了“英超第一中卫”…因此说ws的分值系统可以参考(虽然我觉得sqk的打分体系更合理些),但也不能尽信,还是要看实际比赛具体分析… 还是这位@MiG 兄弟说的中肯,非常同意你就赛后打分来说天空体育确实更准确点概率更大点,但也不每次都准,这都需要人看了球后主观判断的。那么问题来了,评分数据各个系统也是数据打架的。数据可供参考也不能偏废,但咋小小球迷还是实际点,多看看直播或录像,提高自己的鉴赏水平多好。看完球有了自己的直观感受,再来联系数据验证主观感受,不然就是本末倒置了,可能就会迷失在大数据的洪流中了,反而没了看球的乐趣和违背球迷看球为主的初衷了。
下面附客场对女王的赛后评分,举例说明下吧
附1:
天空体育的赛后对队员打分(同是边后卫贝莱林是高分,吉布斯一般,同时374和贝莱林同为全队最高分,个人看过比赛觉得没什么大出入)
http://i2.hoopchina.com.cn/blogfile/201503/07/BbsImg142573835633436_639*781.png
附2:whoscored的赛后对队员打分(同是边后卫吉布斯是最高分,贝莱林一般;同时374还比吉布斯低、居然吉布斯为全队最高分;个人感觉就有点问题了)
http://i3.hoopchina.com.cn/blogfile/201503/07/BbsImg14257384621201_500*357.jpg
[ 此帖被上善厄齐尔在2015-03-07 22:33修改 ]
页:
1
[2]