O blog da AWS

Como o Banco Bmg economizou mais de US$ 2,7 milhões com Spot Instances e Savings Plans na AWS

Por Isaque Rodrigues da Costa, Gerente de Infraestrutura Cloud FinOps no Banco Bmg; Everton Sims Queiroz, Superintendente de Infraestrutura no Banco Bmg; Liz Menichetti, Technical Account Manager na AWS e Marcelo Moras, Arquiteto de Soluções na AWS.

Otimizar custos em nuvem sem comprometer disponibilidade é um dos maiores desafios de clientes do setor financeiro. O Banco Bmg alcançou esse equilíbrio migrando de um cluster on-premises para 70 ambientes Amazon EKS, combinando Spot Instances com Savings Plans e adotando Karpenter para escalabilidade dinâmica. O resultado: uma economia acumulada de US$ 2,73 milhões entre janeiro de 2023 e abril de 2026, com a cobertura On-Demand caindo de 94% para apenas 1,1%.

Sobre o Banco Bmg

Com quase um século de conquistas, inovações e compromissos com clientes, parceiros e colaboradores, o Banco Bmg é uma das instituições financeiras mais tradicionais do Brasil. Pioneiro na oferta de consignado e reconhecido por sua inovação e soluções acessíveis, o Bmg proporciona o acesso ao crédito com juros mais baixos a milhões de brasileiros e oferece uma ampla gama de produtos e serviços financeiros que abrange diversos públicos, como crédito consignado, consignado privado, conta digital, investimentos e seguros, sempre com foco na melhor experiência do cliente.
O banco se destaca pela união entre tecnologia e simplicidade, democratizando o acesso a serviços bancários e valorizando o contato humano, seja em agências bancárias, nas franquias da loja help! e nos correspondentes bancários, levando oportunidades a mais de 9 milhões de clientes em todo o Brasil.

A Estratégia

Uma das principais estratégias adotadas pelo Banco Bmg para aumentar a eficiência operacional e reduzir custos em nuvem foi a modernização da arquitetura de infraestrutura, com o Kubernetes se tornando a principal plataforma de execução de workloads da organização. Esse movimento permitiu transformar um ambiente antes estático, com baixa elasticidade e alto nível de ociosidade, em uma estrutura dinâmica, resiliente e orientada à demanda real de consumo.

O Desafio

Antes dessa transformação, tanto a quantidade de servidores quanto o número de aplicações em execução permaneciam praticamente estáticos ao longo do tempo. Esse cenário levava, em muitos momentos, a um dimensionamento pouco aderente à demanda, com impactos nos custos operacionais e na eficiência do ambiente. Além disso, como as aplicações não contavam com mecanismos automáticos de escalabilidade, períodos de maior demanda podiam gerar pressão sobre os recursos disponíveis, refletindo em oscilações na performance, na experiência dos clientes e na estabilidade dos serviços.

Em 2023, o ambiente do Banco Bmg era composto por:

  • Um cluster Kubernetes on-premises que concentrava a maior parte das aplicações;
  • Diversos clusters de EKS (Amazon Elastic Kubernetes Service) na AWS, todos utilizando apenas instâncias On-Demand;
  • Várias instâncias virtuais rodando Docker Swarm.

Esse modelo apresentava limitações significativas:

  1. Custo elevado devido ao uso exclusivo de instâncias On-Demand;
  2. Baixa flexibilidade para alocação de workloads e crescimento do parque;
  3. Ausência de resiliência e escalabilidade adequadas para lidar com picos de demanda;
  4. Fragmentação operacional entre ambientes on-premises e nuvem.

O Plano de Transformação

Com a definição da nova estratégia tecnológica, o Banco Bmg passou a adotar um modelo baseado em elasticidade e escalabilidade automática. Não apenas os servidores que compõem os clusters Kubernetes passaram a crescer e reduzir dinamicamente, mas também as próprias aplicações. Os workloads passaram a operar com escalabilidade horizontal, aumentando ou reduzindo automaticamente a quantidade de pods, e também com escalabilidade vertical, ajustando recursos computacionais como CPU e memória conforme a necessidade de cada serviço. Dessa forma, os recursos computacionais passaram a ser provisionados sob demanda, acompanhando o comportamento real de utilização do ambiente.

O time de infraestrutura do Bmg liderou um redesenho completo da estrutura:

  • Migração para EKS: as aplicações Docker Swarm foram migradas para EKS, garantindo um ambiente unificado, resiliente e escalável;
  • Expansão para mais de 70 clusters Kubernetes, totalmente hospedados na AWS;
  • Descontinuação do cluster on-premises;
  • Segmentação por ambiente: produção, homologação e desenvolvimento;
  • Adoção do Karpenter, provisionador open-source de nós para Kubernetes que substitui o Cluster Autoscaler, oferecendo provisionamento mais rápido e diversificação automática de tipos de instâncias;
  • Contratação de Compute Savings Plans para workloads previsíveis.

Na prática, sempre que ocorre aumento no volume de acessos, processamento ou utilização de serviços, novos pods são iniciados automaticamente. Caso o cluster não possua capacidade suficiente para suportar a nova demanda, novos nós são criados dinamicamente. Da mesma forma, quando o consumo diminui, os pods excedentes são encerrados e a quantidade de servidores é reduzida automaticamente, eliminando desperdícios e reduzindo ociosidade.

Spot Instances + Karpenter: resiliência com economia

Essa arquitetura elástica também permitiu ampliar de forma significativa o uso de instâncias Spot da AWS, que hoje representam 51% de toda a utilização computacional da organização. As instâncias Spot funcionam em um modelo de aproveitamento de capacidade computacional ociosa da AWS, permitindo utilizar servidores com descontos que podem chegar a até 90% em relação ao modelo tradicional sob demanda. Como contrapartida, a AWS pode requisitar essas instâncias de volta a qualquer momento, com aviso prévio de até dois minutos.

Para viabilizar o uso massivo desse modelo sem comprometer a estabilidade dos serviços, o Banco Bmg desenvolveu uma engenharia de automação voltada para workloads stateless, aplicações que não mantêm estado ou sessões persistentes localmente e, por isso, podem ser interrompidas e reiniciadas sem perda de integridade operacional. Quando a AWS sinaliza, via API, que uma instância Spot será encerrada, o ambiente automaticamente coloca o servidor em modo de manutenção, impedindo que novas cargas sejam direcionadas para ele.

Ao mesmo tempo, os pods em execução recebem um sinal de encerramento controlado, permitindo que concluam os processamentos ativos em até 30 segundos. Durante esse período, os balanceadores de carga deixam de encaminhar novas requisições para essas instâncias, garantindo que nenhuma transação em andamento seja impactada. Paralelamente, novos servidores são provisionados automaticamente e as aplicações são redistribuídas para os novos nós em aproximadamente um minuto.

Os outros 48%, serviços críticos de infraestrutura como Nginx, balanceadores de carga, logs, DNS e observabilidade, permanecem em instâncias cobertas por Savings Plans, garantindo estabilidade para aplicações stateful e serviços essenciais.

A Evolução em Números

A Figura 1 mostra a transformação da cobertura EC2 por tipo de compra ao longo de mais de três anos. Em janeiro de 2023, 94% das horas normalizadas eram On-Demand. Em abril de 2026, esse número caiu para apenas 1,1%, uma redução de 93 pontos percentuais.

Figura 1 — Cobertura mensal EC2 por tipo de compra (% das horas normalizadas). A transição de On-Demand (vermelho) para Spot (amarelo) e Savings Plans (verde) é visível a partir de março/2023, atingindo estabilidade em meados de 2024 com menos de 5% de On-Demand.

Período Janeiro/2023 – Abril/2026:

A Figura 1 também apresenta o painel de cobertura EC2 do Banco Bmg no período de janeiro/2023 a abril/2026. O custo total EC2 no período foi de US$ 2,70 milhões, distribuído entre On-Demand (US$ 646,2k — apenas 24% do gasto), Spot (US$ 839,9k — 31,1%) e Savings Plans (US$ 1,21 Milhão — 44,9%). A economia total entregue pela combinação de Spot e Savings Plans alcançou US$ 2,73 milhões, resultado da diferença entre o que seria pago a preço On-Demand e o custo efetivo alcançado.

Outro fato relevante são as economias geradas através do uso de Spot Instances: US$ 1,84 milhão em pouco mais de 3 anos. Somam-se a isso os US$ 890,8k economizados via Savings Plans.

Métrica Valor
Custo total EC2 US$ 2,70 Mi
Economia via Spot US$ 1,84 Mi
Economia via Savings Plans US$ 890,8k
Economia total (Spot + SP) US$ 2,73 Mi
Cobertura On-Demand atual 1,1%

Economia Crescente Mês a Mês

A Figura 2 demonstra como a economia mensal acelerou ao longo do período à medida que o Bmg expandiu a adoção de Spot e Savings Plans. Em 2023, a economia mensal era de aproximadamente US$ 20k. Em 2026, ultrapassa US$ 160k por mês, um crescimento de 8x.

Figura 2 — (Superior) Tendência de cobertura On-Demand → Spot + Savings Plans em horas normalizadas. (Inferior esquerdo) Economia mensal acumulada em USD, calculada pela fórmula CUDOS (Cloud intelligence Dashboard) oficial. (Inferior direito) Composição total do gasto EC2 no período.

A Figura 2 ilustra três perspectivas complementares da jornada de otimização. No painel superior, a tendência de cobertura mostra a inversão progressiva: o On-Demand (vermelho) que dominava em 2023 foi substituído por Spot (amarelo) e Savings Plans (verde), estabilizando abaixo de 5% desde meados de 2024. No painel inferior esquerdo, o gráfico de barras empilhadas revela o crescimento acelerado da economia mensal, de valores próximos a zero no início de 2023 para mais de US$ 160k/mês em 2026, refletindo tanto o aumento do parque quanto a maturidade da estratégia de compra. Por fim, o gráfico donut (inferior direito) apresenta a composição acumulada do gasto EC2 no período: Savings Plans respondem pela maior fatia, seguidos por Spot e uma parcela residual de On-Demand.

Resultados

Com essa abordagem, o Banco Bmg conseguiu construir uma plataforma altamente escalável, resiliente e eficiente, capaz de crescer e reduzir automaticamente sem necessidade de intervenção humana. O resultado dessa estratégia foi uma operação com 51% de utilização de Spot Instances, 48% de Savings Plans e apenas 1% de consumo On-Demand, alcançando um modelo operacional extremamente otimizado tanto do ponto de vista financeiro quanto tecnológico, mantendo elevados níveis de disponibilidade, performance e eficiência operacional.

Mais do que gerar economia financeira, o Banco Bmg conquistou um ambiente:

  • Altamente escalável, capaz de atender picos de demanda sem desperdício de recursos;
  • Disponível e resiliente, garantindo continuidade operacional mesmo em cenários de interrupção de Spot;
  • Preparado para o futuro, com uma arquitetura moderna baseada em Kubernetes que permite inovação contínua.

Conclusão

A jornada do Banco Bmg na nuvem demonstra que transformação de infraestrutura é um processo contínuo. Ao adotar containers como plataforma central e implementar escalabilidade automática e elástica, o banco não apenas economizou mais de US$ 2,7 milhões, como também reduziu ociosidade, diminuiu incidentes e eliminou a necessidade de intervenção manual na gestão de capacidade. O resultado é uma operação mais eficiente, mais estável e preparada para crescer junto com o negócio.

Autores

Isaque Costa é Gerente de Infraestrutura Cloud e FinOps no Banco Bmg, com mais de 20 anos de experiência liderando transformação digital e operações críticas de tecnologia. Especialista em Cloud Computing, Landing Zones MultiCloud e FinOps, atua na modernização de ambientes corporativos com foco em escalabilidade, segurança e eficiência operacional. Possui sólida trajetória em infraestrutura de TI, conectando inovação, governança e alta performance no setor financeiro.
Everton Queiroz é superintendente de TI no Banco Bmg, com 24 anos de experiência em tecnologia. Formado em Sistemas de Informação e com pós-graduação em Gestão de Projetos, Ciência de Dados e Big Data, lidera áreas estratégicas de infraestrutura de TI, incluindo Cloud, On-Premises, Banco de Dados, Redes, DevOps, SRE, IaC, FinOps, Service Desk e Field Services. Atua com AWS desde 2016, impulsionando inovação e eficiência operacional no setor financeiro.
Liz Menichetti é Technical Account Manager na AWS. Desde 2019 auxilia os clientes da AWS com arquitetura e projetos de destaque nas mais variadas verticais da indústria, com foco em Financial Services, combinando profundidade técnica com visão de negócio para guiar clientes em projetos críticos – aplicando as melhores práticas do Well-Architected Framework em segurança, escalabilidade e resiliência.
Marcelo Moras é Arquiteto de Soluções na AWS atendendo clientes Enterprise com foco em mercado financeiro. Com mais de 18 anos de experiência atuando com infraestrutura, administração de sistemas, redes, containers e segurança.