新闻提要

由 AWS 提供支持的“德甲赛况”的发展历程

承压最多的球员

拜耳 04 勒沃库森足球俱乐部的德甲传奇人物和体育总监西蒙·罗尔费斯(Simon Rolfes)详细介绍了新的“德甲赛况”

西蒙·罗尔费斯的一篇博文

在 2005 年至 2015 年之间,西蒙·罗尔费斯(Simon Rolfes)场上司职中场,共在德甲联赛出场 288 次,打进 41 球,为德国队出场过 26 次。目前,罗尔费斯在拜耳 04 勒沃库森足球俱乐部担任体育总监,负责监督和发展职业球员名册,也负责球探部门及俱乐部年轻人的发展工作。罗尔费斯每周还会在 Bundesliga.com 上撰写专栏,介绍由亚马逊云科技提供支持的最新“德甲赛况”。在专栏中,他贡献了自己作为前球员、队长和电视赛事分析人士的专业知识,强调了高级的统计数据和机器学习带给足球界的影响。在这里,罗尔费斯将与德甲联赛数据科学家 Gabriel Anzer 一道,共同分析由亚马逊云科技提供支持的一些新的“德甲赛况”数据(球迷在 20/21 赛季可以看到)的重要性。随后来自亚马逊云科技专业服务团队的 Luuk Figdor 将详细介绍这些高级的统计数据背后所利用的亚马逊云科技公司的技术。

现代足球节奏变得越来越快,球员正越来越多地在防守中采用压力作为战术。 但对于教练或电视赛事分析人士而言,很难以数据作为依据,来为在何时或向谁施加压力的决策提供支撑,在实时情况下尤其如此。在此之前,也无法量化球员所承受的压力。现在这一切都在发生变化,这得益于亚马逊云科技和德甲所做的努力。

由亚马逊云科技提供支持的最新“德甲赛况”中的“承压最多的球员”这项数据,可实时量化球员所遇到的防守压力。这使得评论员、足球分析师、球迷及球队可以对一些球员与其他球员相比,是如何承受压力的,以及这对比赛产生何种影响进行比较。现在我们可以看到拥有控球权的球员受到对手压迫的频率有多高。我们可以将之与其队友所面临的平均承压次数进行比较。 因此,我们可以判断哪些球员需要逃避压力处境的频率最高,而哪些球员大多数情况下在球场上不会遭受压力。“承压最多的球员”这项数据通过测量对方球员的人数,他们与拥有控球权球员的距离,以及每位球员的移动方向,来显示一名球员遭受重大压力的频率。

解读新“承压最多的球员”洞见的另一个角度是,在比赛中进行的分析(无论是否由数据驱动)主要集中在球队拥有控球权时所采取的策略。不过,当球队未拥有控球权时,其表现会显著不同。随着“承压最多的球员”数据背后的数字压力框架的引入,我们便可以开始对防守型无球动作进行衡量了。这将为球迷们提供新的信息,因而有助于他们更好地理解防守策略。

“承压最多的球员”数据是利用这样一种算法创造的:该算法根据数据点(例如该球员的位置、方位和对手的位置)来对拥有控球权的球员所承受的压力值进行预估。在比赛的整个过程,亚马逊云科技都利用了 Amazon Web Services Fargate、Amazon Web Services Lambda 及 Amazon Web Services DynamoDB 等云计算技术来计算该压力值。如果计算出的压力值超出了某个阈值,那么比赛期间球迷会在屏幕上看到它。球员在巨大压力下的每次有球动作都会计算在内。然后,每个球员都会有一个压力计数,其中包含他所面临的压力情形的次数。

尽管本博文会更深入地介绍亚马逊云科技团队是如何与德甲合作,从而共同打造“承压最多的球员”这项数据的,不过我同时想提醒大家的是,另外两项“赛况”数据(“攻击区”和“平均位置:趋势”)也正在推出。” 在接下来的几周中,我们将更深入地探讨其中的每一项数据,不过想先睹为快的话,可以在德甲主页上查看每个视频,以获得有关这些新洞见的梗概情况。

AWS Professional Services 团队成员之一的数据科学家 Luuk Figdor与德甲合作,携手打造了这些“赛况”数据。现在他将为大家解释这一高级统计数据是如何创造出来的。

西蒙·罗尔费斯(Simon Rolfes)

“承压最多的球员”大揭秘

朱利安·内格尔斯曼(Julian Nagelmann)所执教的莱比锡红牛足球俱乐部(RB Leipzig)便以施加压力时的超凡能力而闻名于世。以尤苏夫·波尔森(Yussuf Poulsen)在比赛第 4 天对阵奥格斯堡足球俱乐部时的进球为例。在进球前的事件中,莱比锡在对奥格斯堡来说本该安全的组织进攻中,给予对方的压迫是越来越强。这将奥格斯堡引向了边线,拉斐尔·弗兰伯杰(Raphael Framberger)接到球后立即处于对方的压力之下。他几乎没办法将球传给队友,这使他处于了不利位置,导致出现失误。莱比锡从失误中快速进攻,经过两次传球,以及最后一记漂亮的进球得分,他们将领先优势扩大到了 2-0。一切都源于压力的增加。

教练的比赛计划中包括许多可使球队获胜的考量,其中包括向哪个球员施加压力,或者何时及何地施加压力。现在,借助新的“承压最多的球员”,我们可以准确地看到哪个球员是最频繁受到攻击的目标,以及最频繁受到压力。 就上述比赛而言,我们发现拉斐尔·弗兰伯杰(Raphael Framberger)是队中承压最多的三名球员之一,拥有 30 个控球权,比队友多 7%。

压力值计算机制

现在,我们已经了解了如何通过压力来更深入地理解比赛,我们不妨更深入一步,来解释其计算方法。技术的最新进步使得人们得以对位置数据进行高质量跟踪。在整个比赛过程中,运动员、裁判和球的位置都得以以高时间分辨率(25 Hz)进行跟踪。这使得我们能够每秒对所有球员的位置进行 25 次评估,从而在每次比赛中能对位置进行大约 320 万至 350 万次评估。这些位置统计信息包可用于构造所有球员和球在任意时间点在球场上的地图。

一旦有了这个位置图,计算压力值的下一步便是确定哪个球员拥有控球权。个人持球(IBP)是通过使用Link 等人率先提出的算法的改进版本计算得出的。工作原理大致如下:如果一名球员离球最近,并且球距离该球员不到 2 米,且该球距离地面不超过 2.5 米,则该球员便拥有控球权。球员必须至少在连续 3 个帧(120 毫秒)内满足这些限制条件,并且在拥有控球权的时间内必须和球接触过一次。这被定义为球的轨迹方向至少改变 15 度。利用 IBP 算法,我们可以将控球权添加到位置地图中,以查看哪个球员在哪个时间点拥有控球权。

控球权

图 1:在包含序列时间戳的足球场上,球员 x 和 y 及球的坐标得以可视化。拥有控球权的球员以黄色突出显示。

一旦知道在既定框架中哪个球员拥有控球权,我们就可以根据对战球队的球员对该球员施加的压力来计算出该框架。为逐帧计算压力,我们采用了一种与 Andrienko 等人类似的方法 该方法中的压力值是基于拥有控球权的球员的位置、直接对手球员的位置以及他所面对的方向计算得出的。这是通过计算拥有控球权的球员周围所谓的压力区来实现的。压力区指的是受压球员目标周围可以承受压力的区域。该压力区的边界以球员的方向为基础,可将其指定为包含 2 个参数的参数曲线:distance_front 和 distance_back。参数 distance_front 指的是可以沿施压目标所面对的方向来对其施加压力的最大距离。施加压力的球员可以从多个角度向施压目标靠近。随着相对于施压目标方向的绝对角度(Θ)的增加,最大施压距离减小,而当 Θ=±180° 时会达到最小。例如,当施压者位于施压目标后面时,则又等于 distance_back 参数。压力区域的距离极限是由一个公式确定的,该公式在极坐标(Θ,L)中近似椭圆形。

压力图

球员可对其施压目标施加的最大压力为 100%。如果施压者正好位于压力目标的位置,则该值适用。压力区量化后,我们便可以计算压力区中任何点所受到的压力。为此,我们还需要另外两个参数:d 类似于从施压者到施压目标之间的距离,而 q 控制的是压力随距离而减弱的速度。我们可以利用这些参数来确立以下公式,从而计算给定框架内施加到压力目标身上的压力大小。

压力值方程式

上面的公式提供了一种可以计算一个球员在一帧(40 毫秒)内对施压目标施加压力的大小的方法。但是,球员可能会受到来自不止一个施压者的压力。在这些情况下,我们会对所有施加压力的球员所施加的压力进行求和,以得出给定时间内的总压力分值。因此,压力值可能会超过 1。

可以将一个控球权中所有帧的压力得分串起来,以了解在施压目标拥有控球权的阶段中压力是如何发展的,进而了解球员是如何应对这一压力的。我们可以通过比赛第 8 天拜仁(FCB)和不莱梅(SV Werder)之间的比赛来说明这一点。

控球权

在本例中,拜仁的边锋勒罗伊·萨内(LeroySané)在中场压力很大的情况下将球接住。当他试图将球脱手时,不莱梅的两名中场立即向他施加压力,希望重新获得控球权。但是,萨内设法摆脱压力,并迅速朝着不莱梅队的球门迈进。当他到达禁区准备射门时,被一名后卫追赶。第二个后卫开始支援,他们设法在萨内射门之前将球从萨内手中夺回。这只是一个例子:可以说明如何通过压力来更好地理解比赛。“承压最多的球员”统计数据为德甲联赛、其球队和球迷提供了一种评估方法,藉由该方法,可首次对哪些球员在球队中面临压力,以及这如何影响着他们的表现进行评估。

摘要

借助该压力框架,球迷可对无球动作进行最终评估,并逐步开始了解防守型策略这一长久以来始终是个谜的策略。球迷们可以看到哪个球员在拥有控球权时受到的压力最多,而这仅仅是开端。“承压最多的球员”是一项出色的新型高级统计数据,可使人们加深对比赛的了解。我们希望您能像我们汇总时一样,从这一全新统计数据的结果中收获诸多乐趣。

准备好开始使用了吗?
了解有关使用 AWS 专业服务的更多信息。