O DESENVOLVIMENTO DOS BUNDESLIGA MATCH FACTS, CRIADO PELA AWS
Most Pressed Player
Simon Rolfes, lenda da Bundesliga e diretor esportivo do Bayer 04 Leverkusen, detalha o novo Bundesliga Match Fact
Entre 2005 e 2015, Simon Rolfes jogou em 288 partidas da Bundesliga como médio-volante, marcou 41 gols e venceu 26 partidas pela Alemanha. Atualmente, Rolfes trabalha como diretor esportivo do Bayer 04 Leverkusen, onde ele supervisiona e desenvolve a lista de jogadores profissionais, o departamento de caça-talentos e o desenvolvimento juvenil do clube. Simon também escreve colunas semanais no Bundesliga.com sobre os últimos Bundesliga Match Facts desenvolvidos pela AWS. Lá, ele oferece sua experiência como ex-jogador, capitão e analista de TV para destacar o impacto das estatísticas avançadas e do machine learning no mundo do futebol. Aqui, Rolfes, juntamente com o cientista de dados da Bundesliga, Gabriel Anzer, analisará a importância de alguns dos novos Bundesliga Match Facts desenvolvidos pela AWS que os torcedores podem ver durante a temporada de 20/21. Em seguida, Luuk Figdor, da equipe da AWS Professional Services, detalhará a tecnologia da AWS usada por detrás dessas estatísticas avançadas.
O futebol moderno está ficando mais rápido, e as defesas estão cada vez mais usando a pressão como tática. Porém, para técnicos ou analistas de TV, é difícil apoiar a decisão de quando ou contra quem pressionar com base em dados, especialmente em tempo real. Até agora, não era possível quantificar a pressão que um jogador recebe. Graças ao trabalho da AWS e da Bundesliga, isso está mudando agora.
"Most Pressed Player", o Bundesliga Match Fact desenvolvido pela AWS mais recente, quantifica em tempo real a pressão defensiva sobre os jogadores. Isso permite que comentaristas, analistas de futebol, torcedores e equipes comparem como alguns jogadores recebem pressão em comparação com os demais e como isso está afetando o jogo. Agora, podemos ver com que frequência um jogador com a posse da bola está sendo pressionado pelos adversários. Podemos comparar isso com o número médio de situações de pressão enfrentadas por seus companheiros de equipe. Dessa maneira, podemos dizer quais jogadores precisam escapar de situações de pressão com mais frequência e quais ficam a maior parte do tempo sozinhos em campo. "Most Pressed Player" mostra com que frequência um jogador está recebendo pressão significativa de seus adversários, medindo o número de jogadores adversários, sua distância até o jogador com a posse da bola, bem como a direção do movimento de cada jogador.
Outro ângulo a ser considerado com o novo insight "Most Pressed Player" é que a análise das partidas, seja ou não orientada por dados, concentra-se principalmente nas estratégias quando um equipe tem a posse da bola. Porém, as equipes se comportam de maneira drasticamente diferente umas das outras quando não têm a posse da bola. Com a introdução da estrutura de pressão numérica por detrás de "Most Pressed Player", podemos começar a medir as ações defensivas sem a posse da bola. Isso fornecerá novas informações aos torcedores e os ajudará a compreender melhor as estratégias defensivas.
A estatística "Most Pressed Player" é calculada usando um algoritmo que estima a pressão sobre o jogador com a posse da bola como um número baseado em pontos de dados, como a posição desse jogador, sua orientação e a posição dos adversários. A AWS usa tecnologias de computação em nuvem, como o AWS Fargate, o AWS Lambda e o AWS DynamoDB, para calcular esse número durante cada momento da partida. Se o valor de pressão calculado exceder um determinado limite, os torcedores o verão na tela durante uma partida. Cada ação de um jogador com a bola em que ele esteja sob pressão significativa é contada. Cada jogador tem então uma contagem de pressão que inclui o número de situações de pressão pelas quais ele passou.
Embora este blog em particular discuta mais a fundo como a equipe da AWS trabalhou com a Bundesliga para dar vida à estatística "Most Pressed Player", não podemos nos esquecer dos outros dois Match Facts que também estão sendo lançados: "Attacking Zones" e "Average Positions: Trends". Vamos nos aprofundar em cada um deles nas próximas semanas, mas só como tira-gosto, confira cada um destes vídeos na página principal da Bundesliga para ter uma visão geral sobre esses dois novos insights.
Luuk Figdor, cientista de dados e membro da equipe da AWS Professional Services que trabalhou com a Bundesliga para dar vida a esses Match Facts, explicará como essa estatística avançada se concretizou.
- Simon Rolfes
Os jogadores do RB Leipzig de Julian Nagelmann são conhecidos pelo seu grande talento quando se trata de fazer pressão. Por exemplo, considere o gol de Yussuf Poulsen contra o FC Augsburg na quarta rodada. Nos eventos que resultaram no gol, o Leipzig aplica uma pressão cada vez maior durante a disputa supostamente segura e sob controle do Augsburg. Isso direciona o Augsburg para a linha lateral e, assim que Raphael Framberger recebe a bola, ele é colocado sob pressão imediata. Ele mal consegue passar a bola para seu companheiro de equipe, deixando-o em uma posição ruim que resulta na perda da bola. Em seguida, o Leipzig ataca rapidamente e, depois de dois passes e uma finalização magnífica, amplia sua vantagem para 2 a 0. Tudo por causa do aumento da pressão.
A estratégia de jogo de um técnico tem diversas considerações que podem levar à vitória, incluindo qual jogador pressionar ou quando e onde pressionar. Agora, com a nova estatística "Most Pressed Player", podemos ver exatamente qual jogador está sendo o alvo e recebendo pressão com mais frequência. Na partida mencionada, vemos que Raphael Framberger estava entre os três jogadores mais pressionados de sua equipe, com 30 posses de bola sob pressão, cerca de 7% a mais do que seus companheiros de equipe.
Agora que vimos como a pressão pode ser usada para compreender melhor o jogo, podemos dar um passo adiante e explicar como ela é calculada. Avanços recentes na tecnologia possibilitaram o rastreamento de dados posicionais de alta qualidade. As posições dos jogadores, dos árbitros e da bola são rastreadas por toda a partida em uma alta resolução temporal (25 Hz). Isso nos permite avaliar as posições de todos os jogadores 25 vezes por segundo, resultando em cerca de 3,2 milhões a 3,5 milhões de posições avaliadas em cada partida. Esses pacotes posicionais podem ser usados para construir um mapa de todos os jogadores e da bola em campo a qualquer momento.
Com esse mapa posicional, o próximo passo para calcular a pressão é determinar qual jogador tem a posse da bola. A posse de bola individual, ou IBP (Individual Ball Possession), é calculada usando uma versão adaptada do algoritmo inicialmente proposto por Link et al. Em linhas gerais, ele funciona da seguinte maneira: um jogador tem a posse da bola quando é o jogador mais próximo dela, a distância entre a bola e o jogador é inferior a 2 metros e a bola não está a mais de 2,5 metros do solo. Essas restrições devem ser atendidas por pelo menos três quadros consecutivos (120 ms) e, dentro dessa posse, um contato com a bola deve ter ocorrido. Isso é definido como uma mudança na direção da trajetória da bola em pelo menos 15 graus. Usando o algoritmo IBP, podemos adicionar a posse de bola ao mapa posicional para visualizar qual jogador tem a posse da bola em um determinado momento.
Figura 1: Coordenadas X,Y do jogador e da bola visualizadas em um campo de futebol durante uma sequência de timestamps. O jogador com a posse da bola é destacado em amarelo.
Sabendo qual jogador tem a posse da bola em um determinado quadro, podemos calcular a pressão baseada em quadros exercida sobre esse jogador pelos jogadores da equipe adversária. Para calcular a pressão quadro a quadro, adotamos uma abordagem semelhante ao trabalho de Andrienko et. al. Nessa abordagem, a pressão baseia-se na localização do jogador com a posse da bola, nas localizações dos adversários diretos desse jogador e na direção para a qual ele está voltado. Isso é feito por meio do cálculo da chamada "zona de pressão" ao redor do jogador com a posse da bola. A zona de pressão é a área ao redor do jogador-alvo na qual ele pode receber pressão. O limite dessa zona de pressão baseia-se na orientação do jogador e pode ser especificado como uma curva paramétrica com 2 parâmetros: distance_front e distance_back. O parâmetro distance_front refere-se à distância máxima na qual um alvo de pressão pode ser pressionado na direção para a qual ele está voltado. Um jogador que aplica pressão pode se aproximar do alvo de pressão por vários ângulos. À medida que o ângulo absoluto (Θ) aumenta em relação à orientação do alvo de pressão, a distância máxima para pressão diminui, atingindo um mínimo quando Θ = ±180◦. Por exemplo, quando o agente de pressão está atrás do alvo de pressão, o que, por sua vez, é igual ao parâmetro distance_back. Os limites de distância da zona de pressão são determinados por uma fórmula que aproxima uma forma oval em coordenadas polares (Θ, L).
A pressão máxima que pode ser exercida por um jogador ao pressionar o alvo pretendido é de 100%. Esse máximo é aplicado quando o jogador pressionador está precisamente na localização do alvo de pressão. Após a quantificação da zona de pressão, podemos calcular a pressão de qualquer ponto nessa zona. Para isso, precisamos de mais dois parâmetros: d, à distância entre o agente de pressão e o alvo de pressão, e q, o expoente que regula a velocidade da queda da pressão em função da distância. Usando esses parâmetros, podemos estabelecer a seguinte fórmula para calcular a pressão aplicada ao alvo de pressão em um determinado quadro.
A fórmula acima fornece uma maneira de calcular a pressão aplicada por um jogador a um alvo de pressão em um quadro (40 ms). No entanto, os jogadores podem ser pressionados por mais do que apenas um agente de pressão. Nesses casos, somamos a pressão aplicada por todos os jogadores que aplicam pressão para obter uma pontuação total de pressão em um determinado momento. Assim, os valores de pressão podem exceder 1.
As pontuações de pressão para todos os quadros em uma posse de bola podem ser concatenadas para entender como a pressão está se desenvolvendo durante uma fase de posse de bola de um alvo de pressão e para descobrir como o jogador é capaz de lidar com essa pressão. Podemos ilustrar isso usando um exemplo da partida entre o FC Bayern (FCB) e o SV Werder Bremen (SVW) na oitava rodada.
Neste exemplo, Leroy Sané, ala do FCB, recebeu a bola no meio-campo sob forte pressão. Enquanto ele tenta se libertar, dois meio-campistas do SVW imediatamente o pressionam na esperança de recuperar a posse da bola. No entanto, Sané consegue se livrar da pressão e move-se rapidamente em direção ao gol do SVW. Chegando na pequena área, ao se preparar para o chute ao gol, ele é perseguido por um zagueiro. Um segundo zagueiro vem em socorro, e eles conseguem roubar a bola de Sané antes que ele consiga chutar. Este é apenas um exemplo de como a pressão pode ser usada para compreender melhor o jogo. A estatística "Most Pressed Player" fornece à Bundesliga, às suas equipes e aos torcedores uma maneira de avaliar pela primeira vez quais jogadores são mais pressionados em relação à sua equipe e como isso está afetando seu desempenho.
A estrutura de pressão permite que os torcedores finalmente avaliem as ações que não envolvem a posse da bola e tenham uma visão mais clara de estratégias defensivas que por muito tempo eram um mistério. Os torcedores podem ver qual jogador é mais pressionado com a posse da bola, e isso é apenas o começo. "Most Pressed Player" é uma nova estatística avançada genial que traz um nível adicional de compreensão para o jogo. Esperamos que você se divirta com o resultado dessa nova estatística tanto quanto nós curtimos colocá-la em prática.