您的位置:首页 >单场解盘 >

编者注:相比于其他体育运动,足球的数据统计和分析工作开展得很晚

时间:2022-06-28 18:06:04 来源:网络整理

编者按:相对于其他运动,足球统计和分析很晚,考虑到比赛的特殊性,没有太多经验可以参考。然而,随着大数据时代的到来,这种趋势越来越明显。我们需要做的不仅仅是收集数据,还要更好地分析数据,为这项运动服务。可以看到,越来越多的先行者开始涌入足球数据分析领域,并取得了不错的成绩,但同志们还需要继续努力!

有一个棒球分析学派认为,如果没有这么多的技术统计数据,棒球比赛会变得更好。他们这样说是因为他们声称当前正在计算的数字不一定是真正反映棒球比赛的决定性数字,它们只是最容易计算的数字。不管你同意与否,它确实指出了棒球数据中的一个痛点,并且仍然是争论的焦点。

这不是你是否相信数据,而是新数据是否真的能取代旧的统计数据。即使是打发时间的普通棒球观察者也往往更习惯于旧的统计数据,部分原因是棒球数据已经存在很长时间了,事实上人们总是习惯于他们已经熟悉的数据,并谨慎学习新的数据分析结果。

对于足球,过去很少有统计数据。事实上,对于这样一个流畅的游戏,如果不借助技术手段,很难统计传球次数等数据。自从人们开始系统地记录有关游戏的一些统计数据以来已经过去了十年,因为人们乐于收集和分析数据并从中赚钱。像OPTA、Prozone这样专注于数据统计分析的公司已经开始出现,他们的盈利模式也是把这些数据卖给俱乐部或者媒体(其实ESPN、SKY Sports等媒体的统计版块都是由OPTA)。

OPTA 工作人员收集游戏数据


编者注:相比于其他体育运动,足球的数据统计和分析工作开展得很晚

就像在棒球或其他一些数据驱动的运动中一样,已经探索了更新和更高级的评估指标,现在人们渴望在足球中找到一些新的统计指标,因为揭示指标必须是数据分析的产物但这不是一蹴而就的,因为今天统计公司在足球领域所做的数据收集工作仅在一百年前的棒球领域完成。

现在足球终于有了很多数据,接下来就是如何更好地利用这些数据了。与棒球等其他一些主流运动项目不同(这些运动领域的数据统计由来已久,数据分析只是最近才出现),目前足球领域的独特情况是对数据进行统计和分析。同时出来。

统计

让我们回到开头的问题,如果没有技术数据,棒球会更好吗?这个问题对足球统计至关重要。

近年来,许多网站如 WhoScored、Squawka 和 FourFourTwo 的 Stats Zone(均由 OPTA 提供支持)如雨后春笋般涌现,以更好地向粉丝展示游戏统计数据。这些网站主要提供个人和团队比赛的统计数据,听起来有点像棒球技术统计数据,它们提供的信息可以让你知道哪个球员是一场比赛,甚至是一个赛季。有一些图形方式可以更好地呈现这些数据,例如热图和通过线图。

FourFourTwo's Stats Zone 软件中的玩家数据接口


编者注:相比于其他体育运动,足球的数据统计和分析工作开展得很晚

但他们没有进一步提供如何使用数据进行游戏分析。对于球队来说,对于某某后卫来说,每场比赛的高拦截率很重要吗? XX射手的低得分率真的意味着他是一名出色的射手,将来应该多传球吗?还是只是因为他运气太差?传球成功率 95% 的后卫是否比传球成功率 78% 的边锋更适合底传?

我们有数据,但我们无法解决它,因为我们不知道哪些数据对游戏分析真正重要。

这是棒球数据革命开始的倒叙:如果您不知道这些统计数据的真正用途是什么,为什么还要引用它们?这就是为什么我不明白为什么在过去的 50 年里,实况棒球中总是提到像 RBI(Run battled in,棒球术语:RBI)这样的无用数据!

毫无疑问,使用数据对某些球员或球队的出色表现做出一些无法证明的假设是绝对错误的。但是,这并不意味着数据不能被使用。

反对使用这些统计数据也意味着反对使用这些统计数据来描述比赛信息以及球队和球员的表现。虽然传统的棒球统计不能有效地分析和预测未来的比赛,但它们对于描述历史信息很有用。尝试在没有任何统计数据的情况下谈论巴尔的摩金莺队过去一周的比赛,或者解释 Clayton Kershaw 的出色表现。

虽然原始统计数据无法解释球员和球队表现好坏的原因,或者未来会怎样,但使用这些统计数据来描述球员和球队的表现是很直观的。


编者注:相比于其他体育运动,足球的数据统计和分析工作开展得很晚

十年前,没有人确切知道哈维每场比赛的传球次数以及他的成功率是多少。如果没有这些信息,大多数人无法了解哈维有多伟大,或者他什么时候开始走下坡路。同样,当你观看洋基队超级巨星德里克·杰特的比赛时,你只能说,“三年前,他的击球率非常高,而今年他的数据下降了。”

即使是最原始的统计数据也能让我们清楚地了解游戏中的情况。如果没有这一步的积累,很难解释为什么会发生这些事情足球数据大数据,或者接下来会发生什么。这些作为数据分析基石的原始统计数据在美国体育界很普遍,但在足球界却是一个全新的概念。

数据分析

我们当然希望从这些简单的描述性统计数据中挖掘出更多关于足球比赛性质的信息。虽然在这方面做了大量的工作并取得了一些进展,但仍处于起步阶段。

总射门率 (TSR) 是高级足球统计数据的鼻祖,最初由 James Grayson 从冰球引入足球。这个指标设计的初衷很简单:强队一般出手较多,同时也会给对手很少的踢球机会。

该统计数据的强大之处在于它具有良好的自相关性并且可以更好地预测结果。实证分析表明,一支球队过去的TSR可以预测球队未来的TSR,并且在未来比赛中的目标和结果比基于球队过去的目标和结果更好地预测。

TSR在赛季初进行排名预测时是一个很好的领先指标(虽然很多砌砖工会忽略这个数据,根据自己的直觉预测最终排名。这里打个口号,指标预测结果表明曼联无法在最终排名中进入前三,但所谓的砖家其实是笔者自己的看法,曼联前三有戏,只能在赛季末挖坟了~),当然,在实际管理团队的时候,就不会那么有效了。


编者注:相比于其他体育运动,足球的数据统计和分析工作开展得很晚

但在冰球比赛中,球队的阵容可以随时调整,高射门次数让我们能够细分出球队表现最好时哪个球员在场上。足球场上只有三个换人,射门次数也很差,这使得TSR对于球员层面的评价非常有限(至少目前还没有)。

最近,预期目标 (ExG) 已成为一项新的衡量标准。从预测的角度来看,ExG 与 TSR 的表现结果持平(Grayson 比较了这两个指标并给出了一些理论分析),但 ExG 的好处之一是它既可以预测团队表现,也可以预测单个球员的表现。换句话说,您可以根据球员的总进球数来预测球员未来将进多少球。

分解投篮数据有点像从棒球的平均打击率 (AVG) 中分解打击率 (BABIP)。事实证明,类似于球员通常很难有始终如一的高或低 BABIP 的事实,球员也很难在很长一段时间内发挥高于或低于自己的 ExG 的统计数据。但必须再次指出,这些工作只是足球数据分析的起步阶段。

谐波数据统计与分析

您可能注意到的一个问题是,很多分析工作都与拍摄有关,但这并不完全正确。例如,Caley 提出的 ExG 模型考虑了导致射门的传球类型。 StatsBomb 的 Ted Knutson 创建了一个称为球员雷达的工具,通过添加球员上场时间、拥有半场控球率等指标,更全面、更准确地描绘球员统计数据。

当然,值得注意的是,这些数据如何整合形成团队的数据是另一个大问题。但目前的数据分析工作还没有包括对现有统计数据以矩阵形式进行综合分析。


编者注:相比于其他体育运动,足球的数据统计和分析工作开展得很晚

发生这种情况的原因有很多,部分原因是公共领域的专家目前只投入很少的时间来研究这些信息。另外,即使你想做很多分析,现在的统计数据大概也只有五到十年的历史,不像棒球有近百年的数据,这让你无法得出更有效的结论。

很可能足球中有很多重要的数据我们还没有收集到,同时一些统计数据可能除了描述之外没有其他分析价值。关键是我们如何找到那些真正值得分析的数据。

归根结底,我们需要统计数据来辅助分析,而分析的目的是找到足球中各种问题的答案。但是,如果棒球中发生的事情教会了我们什么,那就是统计数据的使用既可以帮助我们真正发现有价值的信息,又可以使我们误入歧途,得出错误的结论。

足球领域的统计数据太少,任何指标都需要综合,但足球统计落后棒球一百年,并不意味着足球没有自己独特的评价指标。而足球确实有一个优势,那就是在棒球中,各种基于统计的假设性猜测已经流行了一百年足球数据大数据,才被数据分析所击中,而在足球中,统计和数据分析齐头并进。 .


郑重声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。