採用 AWS 技術的德甲比賽資料開發
最常被盯上的球員
德國甲級足球聯賽傳奇球星暨拜耳 04 勒沃庫森足球俱樂部運動部門董事 Simon Rolfes,詳細說明了全新的德甲比賽資料
在 2005 年至 2015 年期間,Simon Rolfes 以中前衛的身分參加了 288 場德國甲級足球聯賽,為德國踢進了 41 球並贏得 26 場比賽。Rolfes 目前在拜耳勒沃庫森足球俱樂部擔任運動部門董事,負責監督與發展職業球員名冊、球探部門,以及俱樂部的青年發展。Simon 也在 Bundesliga.com 上撰寫每週專欄,發表有關「採用 AWS 技術的德甲比賽資料」的最新消息。此外,他也提供了身為前球員、前隊長與電視分析員的專業知識,強調進階的統計資料和機器學習對足球領域所帶來的改變與影響。Rolfes 與德國甲級足球聯賽資料科學家 Gabriel Anzer 共同合作,分析其中一部分全新「採用 AWS 技術的德甲比賽資料」的重要性,讓球迷在 20/21 球季比賽期間看見這些全新比賽資料所帶來的改變;AWS Professional Services 團隊的 Luuk Figdor 接著詳述這些進階統計資料背後所運用的 AWS 科技。
現代足球的比賽步調變得更加快速,而緊迫盯人的防守戰術也逐漸成為一種施加壓力的策略。 然而,對於教練或電視分析員而言,運用資料來證明何時施加壓力或對誰施加壓力是有難度的一件事,特別是需要即時判斷的情況下。以往,幾乎不可能對於球員遭受的防守壓力予以量化。多虧了 AWS 和德國足球甲級聯賽的共同努力,這一切在今天都改觀了。
最新一期的「採用 AWS 技術的德甲比賽資料」談到了「最常被盯上的球員」概念,將球員遭遇到的防守壓力以即時的方式加以量化。這項進展讓評論員、足球分析員、球迷和球隊得以將某些球員遭受防守壓力的方式與其他球員進行比較,以及這些壓力對球賽造成的各種影響。我們現在可以了解控球球員遭到對手施加防守壓力的頻率。我們也可以將這項資訊與隊友面臨的壓力情境次數平均加以比較。 如此一來,我們就能分辨出哪些球員必須最常跳脫壓力情境,而哪些球員經常在場上被忽略。「最常被盯上的球員」可以透過測量對方球員的數量、與控球球員之間的距離及每一位球員移動的方向來顯示承受最大防守壓力的我方球員。
看待全新「最常被盯上的球員」深入解析的另一個角度是比賽中的分析-不論是否以資料為導向-當球權在某個球隊上時,絕大多數會將焦點放在策略上。但在沒有控球的時候,球隊隊員的表現往往彼此大相徑庭。導入「最常被盯上的球員」概念背後的數值壓力框架之後,我們就可以開始評估無球防守方的動作。這種做法可以為球迷提供全新的資訊,讓球迷更了解防守策略。
「最常被盯上的球員」概念會使用演算法來建立,這套演算法可以根據控球球員的位置、方向及其對手的位置等資料點,以量化的方式來評估控球球員的壓力。AWS 使用雲端運算技術 (例如 AWS Fargate、AWS Lambda 和 AWS DynamoDB) 來計算球賽進行期間的每一個動作。如果計算後的壓力值超過特定閾值,球迷會在球賽進行期間在螢幕上看見這項資訊。讓球員面臨重大壓力的每一個控球動作都會被計入。接著,每一位球員均有壓力計數,呈現他所面臨的壓力情境次數。
儘這篇部落格文章深入探討了 AWS 團隊如何與德國甲級足球聯賽共同合作來將「最常被盯上的球員」概念具體化,請別忘了還有另外兩項比賽資料也一併推出,分別是「攻擊區」和「平均位置:趨勢」。 我們會在接下來幾週內深入探討這些比賽資料的內容,不過可以讓各位先睹為快:在德國足球甲級聯賽主頁上觀賞這些影片,大致了解這些全新深入解析的概念。
Luuk Figdor 是資料科學家、也是 AWS Professional Services 團隊的一員,與德國足球甲級聯賽密切合作將這些比賽資料具體化,現在會說明如何將這些進階統計資料從概念轉變成實際的應用。
- Simon Rolfes
Julian Nagelmann 的 RB 萊比錫球隊最著名的是在施加防守壓力時展現的高超本領。以 Yussuf Poulsen 在第四天球賽對抗奧格斯堡足球俱樂部的射門為例。在這場比賽中,RB 萊比錫在奧格斯堡足球俱樂部按部就班邁向獲勝的比賽風格上,逐步提升防守壓力,最終獲得了勝利。這種策略迫使奧格斯堡足球俱樂部不得不在球場邊線前進,而在 Raphael Framberger 一接到球之後,他也立即面臨了防守壓力。他幾乎無法傳球給他的隊友,被迫處於極差的位置上,因而導致攻守易位的局面。RB 萊比錫在兩次傳球內由守轉攻迅速推進,最終以 2-0 的比數華麗地結束這場球賽。這一切都要歸功於施加了防守壓力。
教練的比賽計畫有許多可以帶來成功的考量,包含施壓哪一位球員或何時施壓。從現在起,有了「最常被盯上的球員」資料,我們可以精確判斷目前被鎖定以及最常遭受防守壓力的是哪一位球員。 在上述的比賽中,我們看見 Raphael Framberger 是球隊前三名最常被施壓的球員,他有 30 次被施壓的控球情況,約較隊友多 7%。
現在,我們了解可以如何運用壓力來更深入地了解球賽,接著要進一步說明這些壓力的計算方式。近年來在科技方面的進展,讓我們可以獲得高品質的位置資料追蹤。整場球賽裡,球員、裁判和足球的位置都可以運用極高的時間解析度 (25 Hz) 來加以追蹤。如此可讓我們評估所有球員每秒 25 次的位置,使每一場比賽都能評估約 320 萬到 350 萬個位置。這些位置資料組可在球賽進行期間,建構出任何特定時刻下所有球員與動態狀況下足球的位置圖。
一旦有了位置圖,計算壓力的下一步就是確定控球的球員是哪一位。計算個別控球 (IBP) 所採用的是最初由 Link 等人所提出的演算法的改編版本。運作的原理大致如下:如果球員是最接近足球的人,那麼他就是控球球員;足球與球員的距離少於 2 公尺,且足球不離地超過 2.5 公尺。這些限制條件必須在至少 3 個連續影格 (120 毫秒) 中滿足,且在持球期間必須接觸到足球。其定義為足球軌跡至少有 15 度角的變化。運用 IBP 演算法,我們可以將控球加入位置圖來檢視特定時間點控球的球員是哪位。
圖 1:X、Y 球員和足球的座標在足球場上視覺化來提供一系列的時間戳記。控球球員會以黃色醒目顯示。
一旦我們在特定影格中知道了控球球員,我們就能根據對方球隊的球員對該名球員所施加的防守壓力來計算以影格為單位的壓力。為了計算以影格為單位的壓力,我們採用的方法是類似於 Andrienko 等人所提出的研究成果。 這種方法的壓力計算是以控球球員的位置、該名球員直接對手的位置與該名球員所面對的方向來進行。透過計算控球球員周遭的所謂壓力區,即可獲得相關數值。壓力區是球員目標周圍的區域,此為球員會受到防守壓力的區域。壓力區的界限會根據球員的方向而定,並且可以指定為具有 2 種參數的參數曲線:distance_front 和 distance_back。參數 distance_front 表示壓力目標會在他所面臨的方向遭受施壓的最大距離。施加防守壓力的球員可以從數種角度接近壓力目標。當相對於壓力目標方向的絕對角 (Θ) 增加時,壓力的最大距離則會減少,而當 Θ = ±180◦ 時,會達到最小值。舉例來說,當施壓者在壓力目標後方時,反過來說也就等於 distance_back 參數。壓力區的距離限制是由極性座標 (Θ, L) 趨近於橢圓形的公式而決定。
球員可對意欲施加壓力的目標所施加之最大壓力為 100%。如果施壓的球員剛好在壓力目標的位置上,就會是 100% 的壓力。一旦壓力區獲得量化,我們就能針對壓力區中的任何一點計算壓力。為了達成這個目標,我們需要兩種參數:d 是施壓者與壓力目標之間的距離,q 是用來調控壓力隨距離減弱之速度的指數。運用這些參數,我們就能建立下列公式來對特定影格計算施加在壓力目標上的壓力。
上述公式提供了計算一位球員在單一影格 (40 毫秒) 施加在壓力目標上之壓力的方式。然而,球員可能會由一位以上的施壓者施加防守壓力。在這些例子裡,我們將所有球員所施加的壓力加總起來,藉此獲得比賽進行期間特定時刻下的壓力分數總計。如此,壓力值可能會超過 1。
控球期間所有影格的壓力分數可加以串連,藉此了解壓力目標在控球階段的期間內,壓力是如何累積起來的,也可以讓我們了解球員處理這種壓力的方式的表現如何。我們可以透過拜仁慕尼黑足球俱樂部 (FCB) 與文達不來梅體育俱樂部 (SVW) 在第八天進行的球賽來說明運作的方式。
在這個範例中,在 FCB 中擔任翼鋒的 Leroy Sané,在中場接到了球、承受極大的防守壓力。儘管他嘗試讓自己逃離防守壓力,SVW 的兩名中前衛立刻上前施加壓力,希望重新獲得球權。然而,Sané 想盡辦法從防守壓力當中逃脫,迅速朝向 SVW 的球門邁進。抵達禁區之後,當他準備踢進臨門一腳時,一位後衛追上了他。第二名後衛隨即前來協助,並試圖在 Sané 射門前奪回球權。這只是其中一個例子,說明壓力可以如何運用,再透過壓力的運用更加了解球賽。「最常被盯上的球員」統計資料提供德國甲級足球聯賽、所有球隊和球迷一種前所未有的方式,透過量化的資料來評估哪些球員正遭受球隊的防守壓力以及這樣的壓力如何影響球員的表現。
壓力框架讓球迷終於可以評估無球動作,並且深入探討長期以來始終是個謎團的防守策略。球迷能了解哪位控球球員最常被施壓,而這些突破只是個開始。「最常被盯上的球員」是一種充滿創意的全新、進階的統計資料,為球賽帶來更深層的剖析與觀點。我們期盼您能夠從這些新的統計資料來獲得更多的球賽樂趣,就如同我們對球賽的熱情而研發出這些方法一般。