AWS가 제공하는 Bundesliga Match Facts의 개발
Most Pressed Player
분데스리가의 전설이자 Bayer 04 Leverkusen의 스포츠 감독인 Simon Rolfes가 전하는 새로운 Bundesliga Match Fact에 대한 상세한 소식
2005년부터 2015년까지 Simon Rolfes는 288건의 분데스리가 경기에서 센터 미드필더로 활약하면서 41득점으로 26회의 우승을 독일에 안겨주었습니다. 현재 Rolfes는 Bayer 04 Leverkusen에서 스포츠 감독으로 재직하면서 프로 선수 명단, 스카우팅 부서 및 클럽 유소년 육성을 감독하고 개발합니다. 또한 Bundesliga.com에 AWS가 지원하는 최신 Bundesliga Match Facts에 대한 주간 칼럼을 기고합니다. 이 칼럼에서 전직 선수, 주장 및 TV 분석가로 활동한 경험을 바탕으로 고급 통계 및 기계 학습이 축구 세계에 미치는 영향을 조명합니다. 여기서 Rolfes는 분데스리가 데이터 사이언티스트인 Gabriel Anzer와 함께 20/21년 시즌 중에 팬들에게 제공되는 AWS 기반의 새로운 Bundesliga Match Facts의 중요성을 분석합니다. 이어서 AWS Professional Services 팀의 Luuk Figdor는 이 고급 통계에 사용된 AWS 기술에 대해 자세히 설명합니다.
현대 축구는 점점 더 빨라지고 있으며 압박 전술을 사용한 수비가 늘어나는 추세입니다. 그러나 코치나 TV 분석가의 입장에서는 데이터를 통해 특히 실시간으로 압박의 시기 또는 대상을 결정하는 데 도움이 되는 정보를 제공하기가 어렵습니다. 지금까지는 선수가 받는 압박을 수량화하는 것이 불가능했지만 AWS와 분데스리가의 노력 끝에 이제는 모든 것이 달라지고 있습니다.
AWS가 지원하는 최신 Bundesliga Match Fact인 “Most Pressed Player”는 선수가 받는 수비 압박을 실시간으로 수량화합니다. 해설자, 축구 분석가, 팬 및 팀은 이 정보를 통해 압박을 받는 선수와 다른 선수를 비교하고 이 압박이 경기에 미치는 영향을 비교할 수 있습니다. 이제 공을 점유한 선수가 상대의 압박을 받는 빈도를 확인할 수 있습니다. 그런 다음 팀원이 압박을 받는 상황의 평균 횟수를 이 빈도와 비교할 수 있습니다. 이렇게 하면 압박 상황에서 가장 자주 벗어나야 하는 선수와 경기장에 혼자 있는 시간이 가장 많은 선수를 알 수 있습니다. Most Pressed Player는 상대 선수의 수, 점유 선수와의 거리 및 모든 선수의 이동 방향을 측정하여 상대의 강한 압박을 가장 자주 받는 선수를 보여줍니다.
새로운 Most Pressed Player 인사이트에서 봐야 할 다른 관점은 경기의 분석이 데이터 기반이든 아니든 팀이 공을 점유할 때의 전략에 대부분 집중된다는 것입니다. 그러나 공을 점유하지 않을 때 팀은 서로 완전히 다르게 움직입니다. Most Pressed Player에는 숫자 압박 프레임워크가 도입되었기 때문에 공이 없을 때의 수비 동작을 측정할 수 있습니다. 이렇게 하면 수비 전략을 더 잘 이해하는 데 도움이 되는 새로운 정보를 팬들에게 제공할 수 있습니다.
Most Pressed Player는 공을 점유한 선수에게 가해지는 압박을 이 선수의 위치, 방향 및 상대 선수의 위치와 같은 데이터 포인트를 기반으로 숫자로 예상하는 알고리즘을 사용하여 만들어졌습니다. AWS는 AWS Fargate, AWS Lambda 및 AWS DynamoDB와 같은 클라우드 컴퓨팅 기술을 사용하여 경기의 모든 순간에 이 숫자를 계산합니다. 계산된 압박 값이 특정 임계값을 초과하는 경우 팬들은 경기 중에 화면에서 이 수치를 볼 수 있게 됩니다. 선수가 공을 가지고 있을 때 상당한 압박을 받은 횟수가 계산되고 모든 선수의 압박 횟수에는 선수가 받은 압박 상황의 수가 포함됩니다.
이 특정 블로그에서는 AWS 팀이 분데스리가와 함께 Most Pressed Player를 만든 방법을 상세히 다루지만 다른 2가지 Match Facts인 “Attacking Zones”와 “Average Positions: Trends”도 출시됩니다. 이 둘에 대해서는 몇 주 후에 자세히 살펴볼 것입니다. 그러나 Bundesliga 기본 페이지의 동영상에서 이 새로운 인사이트에 대한 개요를 확인할 수 있습니다.
Luuk Figdor는 데이터 사이언티스트이자 AWS Professional Services 팀원으로, 분데스리가와 함께 이 Match Facts를 만들었습니다. 이제부터는 Luuk Figdor가 이 고급 통계 기술의 결실을 맺은 방법에 대해 설명할 것입니다.
- Simon Rolfes
Julian Nagelmann의 RB Leipzig는 기술적인 압박을 가하는 것으로 유명합니다. Matchday 4에서 FC Augsburg를 상대로 한 Yussuf Poulsen의 득점이 그 예입니다. 득점으로 연결되는 상황에서 Leipzig는 Augsburg의 안전한 빌드업 플레이를 점점 더 강하게 압박합니다. 이로 인해 Augsburg는 사이드라인으로 밀려나고 Raphael Framberger는 공을 받자마자 즉각적인 압박을 받습니다. 위치가 좋지 않아 동료에게 공을 패스하기 어려웠고 결과적으로 공이 넘어갑니다. 공을 받은 Leipzig는 빠른 스트라이크를 통해 2번의 패스와 환상적인 마무리로 2-0으로 앞섭니다. 이 모든 결과는 압박을 늘렸기 때문입니다.
코치의 경기 계획에는 승리로 이어질 수 있는 많은 고려 사항이 있습니다. 압박할 선수 또는 압박할 시기와 위치가 여기에 포함됩니다. 새로운 Most Pressed Player를 사용하면 목표가 된 선수와 가장 자주 압박을 받는 선수를 정확히 알 수 있습니다. 위의 경기에서 Raphael Framberger는 30회의 공 점유 압박으로 다른 동료 선수보다 약 7% 더 많은 압박을 받으면서 가장 많은 압박을 받은 세 명의 선수 중 한 명이었습니다.
이제 압박을 사용하여 경기를 심층적으로 이해하는 방법을 알았으니 한 단계 나아가 계산 방법을 설명하겠습니다. 최근의 기술 발전 덕에 높은 수준의 위치 데이터 추적이 가능해졌습니다. 선수, 심판 및 공의 위치가 높은 시간 해상도(25Hz)로 전체 경기 내내 추적됩니다. 이 추적을 사용하면 초당 25회에 걸쳐 모든 선수의 위치를 평가할 수 있으며 결과적으로 경기당 약 320만에서 350만 건의 위치가 평가됩니다. 이 위치 패키지를 사용하면 특정 시간에 경기장에 있는 모든 선수와 공에 대한 지도를 만들 수 있습니다.
이 위치 지도를 만든 후 압박을 계산하는 다음 단계는 공을 점유한 선수를 결정하는 것입니다. 개별 공 점유(IBP)는 Link et al이 처음으로 제안한 알고리즘의 수정 버전을 사용하여 계산됩니다. 대략적인 작동 원리는 다음과 같습니다. 선수가 공에 가장 근접한 선수이고 공과 선수의 거리가 2미터 미만이며 공이 땅에서 2.5미터 이상 떨어지지 않으면 이 선수는 공을 점유한 것이 됩니다. 최소 3연속 프레임(120ms) 동안 이 제약 조건이 충족되어야 하고 이 점유 안에서 공 접촉이 이루어져야 합니다. 이는 최소 15도의 공 궤도 방향 변경으로 정의됩니다. IBP 알고리즘을 사용하면 공 점유를 위치 지도에 추가하여 특정 시간에 공을 점유한 선수를 볼 수 있습니다.
그림 1: x,y 선수 및 공 좌표가 축구 경기장에 타임스탬프 순서로 시각화되어 있습니다. 공을 점유한 선수는 노란색으로 강조 표시됩니다.
특정 프레임에 공을 점유한 선수를 알면 상대 팀의 선수가 해당 선수에 가한 프레임 기반 압박을 계산할 수 있습니다. 프레임 단위로 압박을 계산하기 위해 AWS는 Andrienko et. al의 작업과 유사한 접근 방식을 채택했습니다. 이 접근 방식에서 압박은 공을 점유한 선수의 위치, 직접 대항하는 선수의 위치와 선수가 향하는 방향을 기준으로 결정됩니다. 이 계산은 공을 점유한 선수 주위의 압박 영역을 계산하여 수행됩니다. 압박 영역은 목표가 된 선수가 압박을 받을 수 있는 주변 영역을 의미합니다. 이 압박 영역의 경계는 선수의 방향을 기준으로 결정되며 distance_front 및 distance_back이라는 2가지 파라미터를 사용한 파라미터 곡선으로 지정될 수 있습니다. distance_front 파라미터는 압박 목표가 향하는 방향에서 압박을 받을 수 있는 최대 거리를 나타냅니다. 압박을 가하는 선수는 여러 각도에서 압박 목표에 접근할 수 있습니다. 압박 목표의 방향과 관련하여 절대각(Θ)이 증가하면 압박의 최대 거리는 감소하고 Θ = ±180◦일 때 최소값에 도달합니다. 예를 들어 압박자가 압박 목표의 뒤에 있는 경우 이 값은 distance_back 파라미터와 동일합니다. 압박 영역의 거리 제한은 극좌표(Θ, L)의 대략적인 타원 모양을 구하는 공식으로 결정됩니다.
의도한 목표를 압박하는 플레이어가 가할 수 있는 최대 압박은 100%입니다. 최대 압박이 가해지는 경우는 선수가 압박 목표의 위치에 정확히 있을 때입니다. 압박 영역을 수량화하면 압박 영역의 특정 지점에 대한 압박을 계산할 수 있습니다. 이 계산에는 2가지 파라미터가 추가로 필요합니다. 압박을 가하는 선수에서 압박 목표까지의 거리를 나타내는 d와 거리에 따른 압박 감쇠의 속도를 규정하는 지수인 q입니다. 이 파라미터를 사용하면 지정된 프레임에서 압박 목표에 가해지는 압박을 계산하는 다음 공식을 만들 수 있습니다.
위의 공식은 1프레임(40ms)에서 압박 목표에 있는 선수 1명에게 가해진 압박을 계산하는 방법을 제공합니다. 그러나 선수는 둘 이상의 상대 선수로부터 압박을 받을 수 있습니다. 이 경우에는 압박을 가하는 모든 선수의 압박을 합하여 지정된 순간의 총 압박 점수를 구합니다. 따라서 압박 값은 1을 초과할 수 있습니다.
공을 점유한 모든 프레임의 압박 점수를 연결하면 압박 목표가 공을 점유한 단계 중에 압박의 진행 상태를 파악하고 선수가 이 압박을 처리하는 방법을 알아낼 수 있습니다. Matchday 8에서 FC Bayern(FCB)과 SV Werder Bremen(SVW) 간의 경기를 예제로 사용하여 이를 설명할 수 있습니다.
이 예제에서 FCB의 윙인 Leroy Sané는 상당한 압박 중에 미드필드에서 공을 받았습니다. 압박에서 벗어나려고 할 때 SVW의 미드필더 2명이 공을 되찾기 위해 즉시 압박을 가합니다. 그러나 Sané는 가까스로 압박에서 벗어나 SVW의 골대를 향해 빠르게 이동합니다. 박스권에 도착하여 슈팅을 날릴 준비가 되었을 때 추격한 수비수에 의해 저지됩니다. 두 번째 수비수가 도와주러 오고 이 둘은 Sané가 슈팅을 날리기 전에 가까스로 공을 되찾습니다. 이는 압박을 사용하여 경기를 이해하는 방법을 보여주는 한 가지 예입니다. Most Pressed Player 통계는 분데스리가, 팀 및 팬에게 팀과 관련하여 압박을 받는 선수와 이 압박이 실적에 미치는 영향을 평가하는 방법을 최초로 제공합니다.
압박 프레임워크를 사용하면 공이 없을 때의 동작을 최종적으로 평가하고 오랜 시간 미스테리로 남았던 수비 전략을 자세히 들여다 볼 수 있습니다. 팬들은 공 점유 시 가장 많은 압박을 받은 선수를 알 수 있습니다. 그 뿐만이 아닙니다. Most Pressed Player는 경기에 대한 이해도를 한층 높일 수 있는 새로운 고급 통계 기술입니다. AWS는 이 새로운 통계의 결과를 사용하여 축구 팬들이 더 많은 재미를 얻을 수 있기를 바라는 마음으로 이 기술을 만들었습니다.