- 行业›
- AWS 体育行业解决方案
由 AWS 提供支持的“德甲赛况”的发展历程
承压最多的球员
西蒙·罗尔费斯的一篇博文
拜耳 04 勒沃库森足球俱乐部的德甲传奇人物和体育总监西蒙·罗尔费斯(Simon Rolfes)详细介绍了新的“德甲赛况”
在2005年至2015年之间,西蒙·罗尔夫斯作为中场球员打了288场德甲比赛,打进了41个进球,为德国队出场26次。目前,罗尔费斯在拜耳 04 勒沃库森足球俱乐部担任体育总监,负责监督和发展职业球员名册,也负责球探部门及俱乐部年轻人的发展工作。罗尔费斯每周还会在 Bundesliga.com 上撰写专栏,介绍由亚马逊云科技提供支持的最新“德甲赛况”。在专栏中,他贡献了自己作为前球员、队长和电视赛事分析人士的专业知识,强调了高级的统计数据和机器学习带给足球界的影响。在这里,罗尔夫斯和德甲数据科学家加布里埃尔·安泽尔将分析球迷们在20/21赛季中可以看到的一些由AWS提供的新德甲比赛事实的重要性,然后AWS专业服务团队的Luuk Figdor将详细介绍这些高级统计数据背后使用的AWS技术。
现代足球的速度越来越快,防守越来越多地使用压力作为策略。 但对于教练或电视赛事分析人士而言,很难以数据作为依据,来为在何时或向谁施加压力的决策提供支撑,在实时情况下尤其如此。在此之前,也无法量化球员所承受的压力。得益于AWS和德甲联赛的工作,现在一切都发生了变化。
由AWS提供的最新德甲比赛数据 “压力最大的球员” 实时量化了球员遇到的防守压力。这使得评论员、足球分析师、球迷及球队可以对一些球员与其他球员相比,是如何承受压力的,以及这对比赛产生何种影响进行比较。现在我们可以看到拥有控球权的球员受到对手压迫的频率有多高。我们可以将之与其队友所面临的平均承压次数进行比较。 因此,我们可以判断哪些球员需要逃避压力处境的频率最高,而哪些球员大多数情况下在球场上不会遭受压力。Most Pressed Player 通过测量对手的数量、他们与控球球员的距离以及每位球员的移动方向,来显示球员受到对手巨大压力的频率。
从另一个角度来看 “最受压球员” 的新见解是,比赛中的分析,无论是否由数据驱动,都主要侧重于一支球队拥有控球权时的策略。不过,当球队未拥有控球权时,其表现会显著不同。随着“承压最多的球员”数据背后的数字压力框架的引入,我们便可以开始对防守型无球动作进行衡量了。这将为球迷提供新的信息,帮助他们更好地了解防守策略。
“压力最大的球员” 是使用一种算法创建的,该算法根据该球员的位置、方向和对手的位置等数据点将持球者承受的压力估计为一个数字。在比赛的整个过程,亚马逊云科技都利用了 Amazon Web Services Fargate、Amazon Web Services Lambda 及 Amazon Web Services DynamoDB 等云计算技术来计算该压力值。如果计算出的压力值超出了某个阈值,那么比赛期间球迷会在屏幕上看到它。球员在巨大压力下的每次有球动作都会计算在内。然后,每个玩家都有一个压力计数,其中包含他所面临的压力情况的数量。
虽然这篇博客更深入地探讨了 AWS 团队如何与德甲合作,让 “压力最大” 的球员变为现实,但我们不要忘记现在还发布了另外两个 “进攻区域” 和 “平均位置:趋势”。 我们将在接下来的几周内更深入地研究其中的每一个,但先睹为快:在德甲主页面上查看这些视频,以了解这些新见解的概述。
由亚马逊云科技提供支持的“德甲赛况”:“承压最多的球员”
数据科学家、 AWS专业服务团队成员Luuk Figdor曾与德甲合作将这些比赛事实变为现实,他现在将解释这一高级统计数据是如何实现的。
-西蒙·罗尔夫斯
“承压最多的球员”大揭秘
朱利安·内格尔斯曼(Julian Nagelmann)所执教的莱比锡红牛足球俱乐部(RB Leipzig)便以施加压力时的超凡能力而闻名于世。以尤苏夫·波尔森(Yussuf Poulsen)在比赛第 4 天对阵奥格斯堡足球俱乐部时的进球为例。在进球前的事件中,莱比锡在对奥格斯堡来说本该安全的组织进攻中,给予对方的压迫是越来越强。这将奥格斯堡引向了边线,拉斐尔·弗兰伯杰(Raphael Framberger)接到球后立即处于对方的压力之下。他几乎没办法将球传给队友,这使他处于了不利位置,导致出现失误。莱比锡从失误中快速进攻,经过两次传球,以及最后一记漂亮的进球得分,他们将领先优势扩大到了 2-0。一切都源于压力的增加。
教练的比赛计划中包括许多可使球队获胜的考量,其中包括向哪个球员施加压力,或者何时及何地施加压力。现在,借助新的“承压最多的球员”,我们可以准确地看到哪个球员是最频繁受到攻击的目标,以及最频繁受到压力。 就上述比赛而言,我们发现拉斐尔·弗兰伯杰(Raphael Framberger)是队中承压最多的三名球员之一,拥有 30 个控球权,比队友多 7%。
压力值计算机制
现在,我们已经了解了如何通过压力来更深入地理解比赛,我们不妨更深入一步,来解释其计算方法。技术的最新进步使得人们得以对位置数据进行高质量跟踪。在整个比赛过程中,运动员、裁判和球的位置都得以以高时间分辨率(25 Hz)进行跟踪。这使得我们能够每秒对所有球员的位置进行 25 次评估,从而在每次比赛中能对位置进行大约 320 万至 350 万次评估。这些位置统计信息包可用于构造所有球员和球在任意时间点在球场上的地图。
一旦有了这个位置图,计算压力值的下一步便是确定哪个球员拥有控球权。个人控球率(IBP)是使用Link等人最初提出的算法的改编版本计算的。工作原理大致如下:如果一名球员离球最近,并且球距离该球员不到 2 米,且该球距离地面不超过 2.5 米,则该球员便拥有控球权。球员必须至少在连续 3 个帧(120 毫秒)内满足这些限制条件,并且在拥有控球权的时间内必须和球接触过一次。这被定义为球的轨迹方向至少改变 15 度。利用 IBP 算法,我们可以将控球权添加到位置地图中,以查看哪个球员在哪个时间点拥有控球权。
一旦知道在既定框架中哪个球员拥有控球权,我们就可以根据对战球队的球员对该球员施加的压力来计算出该框架。为了逐帧计算压力,我们采用了与安德烈恩科等人研究类似的方法。该方法中的压力值是基于拥有控球权的球员的位置、直接对手球员的位置以及他所面对的方向计算得出的。这是通过计算拥有控球权的球员周围所谓的压力区来实现的。压力区指的是受压球员目标周围可以承受压力的区域。该压力区的边界以球员的方向为基础,可将其指定为包含 2 个参数的参数曲线:distance_front 和 distance_back。参数 distance_front 指的是可以沿施压目标所面对的方向来对其施加压力的最大距离。施加压力的球员可以从多个角度向施压目标靠近。随着相对于施压目标方向的绝对角度(Θ)的增加,最大施压距离减小,而当 Θ=±180° 时会达到最小。例如,当施压者位于施压目标后面时,则又等于 distance_back 参数。压力区域的距离极限是由一个公式确定的,该公式在极坐标(Θ,L)中近似椭圆形。
图 1:在足球场上可视化的 x、y 球员和球坐标,显示一系列时间戳。拥有控球权的球员以黄色突出显示。
球员可对其施压目标施加的最大压力为 100%。如果施压者正好位于压力目标的位置,则该值适用。压力区量化后,我们便可以计算压力区中任何点所受到的压力。为此,我们还需要另外两个参数:d 类似于从施压者到施压目标之间的距离,而 q 控制的是压力随距离而减弱的速度。我们可以利用这些参数来确立以下公式,从而计算给定框架内施加到压力目标身上的压力大小。
压力目标
上面的公式提供了一种可以计算一个球员在一帧(40 毫秒)内对施压目标施加压力的大小的方法。但是,球员可能会受到来自不止一个施压者的压力。在这些情况下,我们会对所有施加压力的球员所施加的压力进行求和,以得出给定时间内的总压力分值。因此,压力值可能会超过 1。
可以将一个控球权中所有帧的压力得分串起来,以了解在施压目标拥有控球权的阶段中压力是如何发展的,进而了解球员是如何应对这一压力的。我们可以通过比赛第 8 天拜仁(FCB)和不莱梅(SV Werder)之间的比赛来说明这一点。
控球权
在本例中,拜仁的边锋勒罗伊·萨内(LeroySané)在中场压力很大的情况下将球接住。当他试图将球脱手时,不莱梅的两名中场立即向他施加压力,希望重新获得控球权。但是,萨内设法摆脱压力,并迅速朝着不莱梅队的球门迈进。当他到达禁区准备射门时,被一名后卫追赶。第二个后卫开始支援,他们设法在萨内射门之前将球从萨内手中夺回。这只是一个例子:可以说明如何通过压力来更好地理解比赛。“承压最多的球员”统计数据为德甲联赛、其球队和球迷提供了一种评估方法,藉由该方法,可首次对哪些球员在球队中面临压力,以及这如何影响着他们的表现进行评估。
摘要
借助该压力框架,球迷可对无球动作进行最终评估,并逐步开始了解防守型策略这一长久以来始终是个谜的策略。球迷们可以看到哪个球员在拥有控球权时受到的压力最多,而这仅仅是开端。“承压最多的球员”是一项出色的新型高级统计数据,可使人们加深对比赛的了解。我们希望您能像我们汇总时一样,从这一全新统计数据的结果中收获诸多乐趣。