O blog da AWS

Clube Atlético Mineiro: Como o Galo usou IA/ML para transformar dados em mais de R$ 15 milhões com a AWS

Por Leandro Evangelista, CIO do Clube Atlético Mineiro; Vinicius Teodoro, CTO da Guidance e Thamires Cunha, Enteprise Solutions Architect na Amazon Web Services (AWS).

O futebol profissional vive uma mudança silenciosa: clubes ao redor do mundo estão deixando de tomar decisões apenas com base em intuição e passando a usar dados e inteligência artificial para precificar ingressos, reter torcedores e personalizar experiências. No Brasil, o Galo é um dos pioneiros nesse movimento.

O Clube Atlético Mineiro

Fundado em 1908, o Clube Atlético Mineiro é um dos maiores clubes de futebol do Brasil e da América do Sul. Com uma das maiores torcidas do país, títulos nacionais e internacionais que incluem a Copa Libertadores, e o moderno estádio Arena MRV, inaugurado em 2023 com capacidade para 45 414 torcedores, o Galo combina paixão centenária com uma visão crescente de inovação e gestão profissional.

Nos últimos anos, o clube deu um passo decisivo rumo à modernização digital: em parceria com a Guidance, AWS Partner especializada em dados e inteligência artificial, e com o suporte da infraestrutura AWS, o Atlético-MG estruturou uma estratégia de Dados e IA capaz de impactar decisões do dia a dia para melhorar receitas, custos e personalizar experiências, levando o padrão de relacionamento entre clube e sócio torcedor a um novo patamar.

O Desafio

Com mais de 9 milhões de torcedores, 100 mil sócios torcedores e um estádio repleto de fãs nos dias de jogo, o Atlético-MG detém um ativo valioso: dados. Mas como acontece com muitas organizações, esses dados estavam dispersos em sistemas distintos (ticketing, alimentação, loja online, catracas, sócio torcedor e Wi-Fi) sem integração e sem capacidade analítica para gerar valor real ao negócio.

Três desafios de negócio foram mapeados:

1. Precificação sem inteligência: Cada jogo possui características únicas de demanda como adversário, dia da semana, importância da partida, engajamento nas redes sociais, mas o clube precificava os ingressos sem considerar essas variáveis. O resultado era receita de bilheteria abaixo do potencial e assentos vazios que poderiam ter sido ocupados com a estratégia certa.

2. Evasão de sócios torcedores: Mais de 50% da base de associados não renovava o plano ao final do ciclo. Sem visibilidade sobre quais sócios estavam em risco e sem comunicação personalizada baseada em comportamento, as ações de retenção eram genéricas e pouco eficazes.

3. Jornada do torcedor homogênea: A experiência no aplicativo, nas comunicações e nos pontos de venda era igual para todos. Um torcedor que vai a todos os jogos e consome cerveja recebia a mesma mensagem de um sócio inativo que nunca entrou na Arena. Isso reduzia o engajamento, a conversão e a receita dos pontos de venda.

A projeção era clara: sem dados integrados e modelos de IA, a rentabilidade do negócio ficaria limitada.

A solução

Para resolver esses desafios, o Atlético-MG, com a execução da Guidance e a infraestrutura da AWS, construiu uma plataforma completa de dados e IA estruturada em quatro camadas: centralização dos dados, modelos preditivos, hiperpersonalização em tempo real e autonomia analítica para as áreas de negócio.

Serviços AWS envolvidos na solução:

Serviço Papel na solução
Amazon S3 Armazenamento do data lake (GALOLAKE) e dos artefatos dos modelos treinados.
Amazon EMR Processamento distribuído dos dados para preparação das features e ingestão no data lake.
AWS Glue Catalog Catálogo centralizado de metadados, apoiando governança e descoberta dos dados.
Amazon SageMaker Ambiente de desenvolvimento e ciclo de vida dos modelos de machine learning.
Amazon Athena Consultas SQL serverless sobre o data lake para análises e monitoramento de predições.
Amazon Redshift Data warehouse para consolidação de métricas e alimentação dos dashboards de negócio.
Amazon SQS Fila de mensagens que desacopla o pipeline de predições da entrega ao Customer Relationship Management (CRM).
AWS Lambda Orquestração serverless dos fluxos de inferência, monitoramento e integração com o CRM.
Amazon DynamoDB Armazenamento em tempo real dos perfis personalizados entregues pelo SuperApp.
Amazon Bedrock Serviço da AWS para construir aplicações e agentes de IA generativa em escala de produção.

GALOLAKE: A fundação de dados

O primeiro passo foi consolidar todas as fontes de dados do clube em um Data Lake centralizado, o GALOLAKE, armazenado no Amazon S3, com 96% das tabelas operando em formato Apache Iceberg. Esse formato moderno de tabela permite transações ACID (Atomicidade, Consistência, Isolamento e Durabilidade), versionamento e evolução de schema, tornando o data lake auditável, rastreável e pronto para consumo analítico e preditivo.

Hoje o GALOLAKE reúne 552 tabelas, 9.434 colunas e aproximadamente 1,8 bilhão de registros provenientes de fontes internas (ingressos, alimentação, pagamentos, sócio torcedor, catracas, loja online, Wi-Fi) e fontes externas estratégicas (IBGE, INMET/Clima, redes sociais via Emplifi, estatísticas de futebol via API Foot).

O resultado é uma visão 360 do torcedor: o clube passou a enxergar, em uma única plataforma, o comportamento de cada associado, desde o histórico de compras na lanchonete até sua frequência em jogos, plano de sócio, engajamento digital e contexto socioeconômico.

Pipeline de MLOps com Amazon SageMaker

A Guidance adotou o Amazon SageMaker AI como o hub central do ciclo de vida dos modelos de machine learning, cobrindo desde o desenvolvimento até o registro dos artefatos treinados.

Os Notebook Instances serviram como ambiente principal de experimentação e desenvolvimento, onde a equipe construiu, testou e validou os modelos de precificação e churn. O MLflow, integrado ao SageMaker, atuou como camada de tracking de experimentos, registrando métricas, parâmetros e versões de cada modelo treinado para apoiar rastreabilidade e governança do processo científico.

O Amazon EMR processa os dados em larga escala que alimentam as esteiras de treinamento. Após o treinamento, a equipe persiste os artefatos dos modelos no Amazon S3 e os serve via FastAPI em instâncias Amazon EC2, expondo os modelos como endpoints de inferência consumíveis pelas aplicações downstream.

Modelo 1: Precificação dinâmica de ingressos

A equipe treinou o modelo de pricing com dados históricos de bilheteria, cruzados com variáveis esportivas (importância da partida, histórico de confrontos), temporais (dia da semana, horário) e de popularidade (engajamento digital no Instagram medido pela Emplifi e ranking Conmebol).

Um dos principais desafios do modelo é a alta dimensionalidade do problema: cada partida é um evento único, com poucas partidas verdadeiramente comparáveis entre si, mas com muitas variáveis externas que influenciam a demanda. Isso torna as variáveis contextuais, como o peso do jogo no campeonato, o adversário, o momento do clube e o engajamento digital, determinantes para capturar os padrões que os dados históricos sozinhos não conseguem generalizar.

O modelo é consumido por uma plataforma analítica web que exibe, para os gestores, os 3 próximos jogos com o preço ótimo recomendado por setor, curvas de elasticidade de demanda e o infográfico de ocupação por área do estádio. A solução adota ainda uma estratégia de human-in-the-loop: a IA gera as recomendações, mas a decisão final permanece com os gestores, que escolhem pontos dentro da curva de elasticidade que são mais aderentes ao objetivo estratégico da partida.

Modelo 2: Prevenção de evasão de sócios (churn)

O modelo de churn constrói um perfil comportamental de cada CPF ativo, combinando histórico de assiduidade (idas ao estádio), dados financeiros (plano, inadimplência) e engajamento social (interações no app). Dezenas de árvores de decisão são treinadas em varredura profunda para identificar onde o interesse do sócio começa a se distanciar.

O preditor roda em processamentos diários: uma AWS Lambda aciona o endpoint de inferência, que retorna as predições de propensão ao cancelamento para cada sócio ativo. Os resultados são persistidos no Amazon S3, catalogados via AWS Glue Catalog e consultados pelo Amazon Athena, permitindo análises e segmentações sobre as predições sem acessar o modelo diretamente.

O monitoramento de data drift compara continuamente as características dos sócios atuais com os perfis históricos de treinamento. Desvios significativos disparam alertas automáticos de mudança de cenário.

Os sócios com propensão elevada ao cancelamento são segmentados por perfil (“Torcedor de Sofá”, “Economia”, “Pé Quente”, entre outros) e têm seus dados enviados automaticamente ao CRM ActiveCampaign via Amazon EMR, Amazon SQS e AWS Lambda, disparando réguas de comunicação personalizadas com base no ROI estimado de cada ação.

Modelo 3: Hiperpersonalização no SuperApp

Antes de cada jogo na Arena MRV, o motor de hiperpersonalização analisa o histórico de consumo de cada torcedor com ingresso confirmado (por meio da bilheteria NewC) e o classifica em um segmento de preferência de alimentação e bebida, com bloqueio automático de recomendação alcoólica para menores de 18 anos.

Os perfis personalizados de 90% dos torcedores elegíveis são gravados em tempo real no Amazon DynamoDB, com conteúdo (título, corpo, CTA, imagem e link) em três idiomas (português, inglês e espanhol), prontos para consumo imediato pelo SuperApp. Os 10% restantes são reservados como grupo de controle (teste A/B), apoiando a mensuração científica do impacto da personalização.

O mesmo motor atua continuamente sobre o ciclo de vida do plano de cada sócio, classificando-o por status (ativo, inativo, sem plano) e proximidade de vencimento, e disparando jornadas de comunicação personalizadas para prevenir evasão e incentivar renovação.

Capacidade 4: “Pergunte aos Dados do Galo”, Agente de IA com AWS Bedrock AgentCore

Além dos modelos preditivos, a Guidance desenvolveu a solução “Pergunte aos Dados do Galo”, uma interface conversacional que permite a qualquer gestor do clube fazer perguntas em linguagem natural e obter respostas fundamentadas nos dados do GALOLAKE.

Perguntas como “Quantos ingressos o Atlético vendeu no último clássico?”, “Qual o percentual do faturamento de A&B que vem de cerveja?” ou “Quantos ingressos já foram vendidos para o próximo jogo?”, que antes demandavam analistas e horas de trabalho, passaram a ser respondidas em segundos diretamente na plataforma.

A solução é construída sobre o Amazon Bedrock AgentCore, que gerencia o ciclo cognitivo do agente: ao receber uma pergunta, o agente raciocina sobre a intenção, consulta uma semantic layer em YAML com as definições das tabelas e regras de negócio do GALOLAKE, e executa a consulta resultante no Amazon Athena com permissão exclusiva de leitura. Um módulo de guardrail intercepta automaticamente perguntas fora do escopo antes de qualquer acesso ao banco.

O resultado é uma camada de autonomia analítica que torna acessível o acesso à inteligência dos dados para todas as áreas do clube, sem necessidade de conhecimento técnico em SQL ou ferramentas de BI.

Monitoramento e observabilidade

Um pipeline dedicado monitora os modelos em produção: o AWS Lambda coleta as predições, que a solução armazena no Amazon S3 e cataloga através do AWS Glue Data Catalog. A equipe consulta as métricas usando Amazon Athena e Amazon Redshift, e as visualiza em Grafana (monitoramento técnico) e Power BI (dashboards de negócio para as 7 áreas do clube).

Arquitetura da solução

Figura 1 — Pipeline de MLOps dos modelos preditivos do Galo sobre a AWS, desde o treinamento no Amazon SageMaker AI até o serving em FastAPI/EC2 e o monitoramento das predições.

Figura 1 — Pipeline de MLOps dos modelos preditivos do Galo sobre a AWS, desde o treinamento no Amazon SageMaker AI até o serving em FastAPI/EC2 e o monitoramento das predições.

Resultados

Os resultados alcançados pelo Clube Atlético Mineiro desde a implantação da plataforma de dados e IA — construída pela Guidance sobre a infraestrutura AWS — superam as expectativas iniciais e demonstram o poder da inteligência artificial quando ancorada em dados de qualidade e na nuvem:

Impacto financeiro consolidado:

  • Mais de R$ 15 milhões de lucro através de iniciativas de dados e IA.
  • Receita de bilheteria gerenciada com suporte preditivo superior a R$ 54 milhões.
  • Mais de R$ 3 milhões originados em overbooking preditivo, assentos ocupados que de outra forma ficariam vagos.
  • R$ 4 milhões de lucro em 5 meses com o ajuste da elasticidade de descontos para sócios adicionais.
  • Mais de R$ 150.000 de lucro potencial por jogo com a melhoria na gestão da venda e resgate de ingressos.

Modelos preditivos em produção:

  • 5 modelos de ML automatizados operando na ponta.
  • Modelo de precificação com 88,04% de acerto (R² Score) na explicação das oscilações de venda de ingressos.
  • Modelo de churn com 92,2% AUC-ROC e 80,3% de precisão, gerando um aumento prático de 27% na retenção de sócios abordados e mais de R$ 1 milhão de retorno direto ao clube.

Autonomia e cultura data-driven:

  • 7 áreas do clube tomando decisões com base em dados, utilizando dashboards analíticos customizados.

Depoimento

“Aqui no Galo, a tecnologia só faz sentido quando impacta resultado. A Guidance opera com essa mesma lógica. Diante do volume de dados e da complexidade da precificação, estruturamos uma estratégia de dados e IA que transformou decisões críticas em processos mais rápidos, precisos e consistentes.”

Leandro Evangelista, CIO do Clube Atlético Mineiro

Próximos passos

O caminho do Atlético-MG está apenas no início. Com a base sólida do GALOLAKE e cinco modelos em produção, o clube avança com foco em quatro frentes: hiper-personalização de jornada com mensagens únicas para cada torcedor por canal; cultura data-driven difundida em todas as áreas; monitoramento e retroalimentação contínua dos modelos; e a criação de plataformas interativas que permitam às áreas construir análises e acionar IA de forma autônoma.

Com o “Pergunte aos Dados do Galo” já em desenvolvimento sobre SageMaker e AgentCore, a próxima fronteira é expandir essa experiência conversacional para toda a base de gestores e integrá-la a novas fontes de dados, tornando a inteligência do GALOLAKE acessível a qualquer área do clube em tempo real.

Com o “Pergunte aos Dados do Galo” em produção sobre o Amazon Bedrock AgentCore, a próxima fronteira é expandir essa experiência conversacional para toda a base de gestores e integrá-la a novas fontes de dados. O clube já utiliza modelos de IA generativa para democratizar o acesso à inteligência dos dados, tornando o GALOLAKE acessível a qualquer área do clube em tempo real.

O Atlético Mineiro está construindo não apenas um time campeão dentro de campo, mas uma organização AI-First — onde dados e inteligência artificial fazem parte da rotina de todos os times e os resultados são concretos, mensuráveis e crescentes.

Saiba mais

Para aprofundar nos serviços utilizados nesta solução e dar os próximos passos com IA/ML na AWS, acesse:

Autores

Leandro Evangelista é CIO do Clube Atlético Mineiro, responsável por liderar a estratégia de dados e IA do grupo.
Vinicius Teodoro é CTO da Guidance, mestre em Ciência da Computação com foco em IA.
Thamires Cunha é Arquiteta de Soluções Enterprise na Amazon Web Services (AWS).