Histórias de clientes / Software e Internet / Turquia

2023
logotipo da codeway

Codeway economiza 48% em custos de computação para IA generativa usando instâncias G5 do Amazon EC2

Saiba como a Codeway otimizou a relação preço/desempenho para seu aplicativo de IA generativa, o Wonder, usando instâncias G5 do Amazon EC2 com GPU NVIDIA.

Redução de 48%

em custos de computação

1,5 milhão de usuários ativos mensais

em mais de 160 países

Menos de 3,5 meses

para implantar na AWS

Gestão

operacional simplificada

Desempenho

ideal

Visão geral

Com mais de 140 milhões de usuários em mais de 160 países, a Codeway causou um impacto significativo no mundo dos aplicativos e jogos móveis por meio do poder da inteligência artificial generativa. Conforme sua base de usuários crescia, a Codeway buscou melhorar a escalabilidade, a elasticidade e a eficiência de custos das workloads que sustentam essa poderosa tecnologia.

Depois de receber recomendações da Amazon Web Services (AWS), a Codeway optou por adotar o Amazon Elastic Compute Cloud (Amazon EC2) em instâncias G5 equipadas com GPUs NVIDIA A10G Tensor Core, instâncias baseadas em GPU de alto desempenho para aplicações de machine learning e gráficos intensivos, para potencializar seu aplicativo de geração de imagens, o Wonder. Ao otimizar a infraestrutura do Wonder na AWS, a Codeway manteve o desempenho ideal, reduziu os custos em comparação com sua estratégia de computação anterior e escalou de forma eficaz para ajudar milhões de criadores de conteúdo a dar vida às suas ideias.

Woman working on mobile phone in the station

Oportunidade | Escalando a computação para IA generativa e, ao mesmo tempo, reduzindo os custos da Codeway

Com sede em Istambul, Turquia, a Codeway desenvolve aplicativos e jogos móveis com tecnologias de ponta, especialmente IA generativa. Seu aplicativo Wonder transforma palavras em imagens digitais; os usuários inserem palavras ou frases, e o Wonder transforma essas entradas em arte implantando modelos de difusão estáveis para geração de imagens com base no PyTorch na AWS. Dependendo da assinatura, os usuários podem baixar uma versão de alta ou baixa qualidade da imagem.

Como o Wonder foi baixado por mais de 28,3 milhões de usuários, a Codeway se esforça para maximizar seus recursos de computação e GPU. A infraestrutura do Wonder é distribuída em vários provedores de nuvem em várias regiões. Para workloads de inferência de inteligência artificial (IA), a Codeway estava usando GPUs NVIDIA A100 Tensor Core hospedadas em um desses fornecedores. No entanto, ele encontrou problemas de capacidade da GPU que afetaram o desempenho.

“Essas workloads exigem um hardware com muito uso de GPU. Também estamos adicionando milhões de usuários todos os meses, então nossa demanda por GPUs só aumentará”, diz Ugur Arpaci, engenheiro-chefe de DevOps da Codeway. “À medida que passamos do gerenciamento de centenas de GPUs para milhares, queríamos otimizar o custo e o desempenho e encontrar uma boa estratégia de escalabilidade.”

O Amazon EC2 oferece um portfólio de computação amplo e profundo, com mais de 600 instâncias e uma opção das mais recentes opções de processador, armazenamento, rede, sistema operacional e modelo de compra para ajudar os clientes a melhor atender às necessidades de suas workloads. Enquanto a Codeway procurava maneiras de otimizar sua computação, descobriu uma solução ideal: instâncias G5 do Amazon EC2 equipadas com GPUs NVIDIA A10G Tensor Core. Embora a Codeway tivesse a opção de escolher entre GPUs semelhantes às de outros provedores de nuvem, eles não ofereciam a mesma disponibilidade e escalabilidade da AWS.

“A equipe da AWS sugeriu que poderíamos atingir nossas metas de preço-desempenho adotando instâncias G5 do Amazon EC2 equipadas com GPUs NVIDIA A10G Tensor Core”, diz Arpaci. “Começamos a testar isso e vimos bons resultados.”

kr_quotemark

Na AWS, podemos segmentar nossas workloads para oferecer melhor desempenho aos nossos usuários.”

Ugur Arpaci
Engenheiro-chefe de DevOps, Codeway

Solução | Executando modelos de difusão estável baseados em PyTorch para Wonder na AWS em 3,5 meses

Depois de analisar a relação preço/desempenho das instâncias G5 do Amazon EC2, a Codeway trabalhou em conjunto com a equipe da AWS para concluir o processo de integração. “Sempre estivemos em contato com os especialistas da AWS”, diz Arpaci. “Seguimos suas orientações e, em seguida, realizamos testes e calculamos os custos de nossa parte. Para determinados modelos, percebemos que poderíamos obter o máximo de benefícios implantando nosso aplicativo nas instâncias G5 do Amazon EC2. Em seguida, compartilhamos nossos resultados e estabelecemos um ciclo de feedback muito positivo.”

O processo de integração foi rápido e simples e, em 3,5 meses, a Codeway estava executando workloads de produção para o Wonder na AWS. Agora, ele usa instâncias G5 do Amazon EC2 com GPUs A10G para implantar quase todas as workloads de inferência de IA para a versão gratuita do Wonder. Para gerar imagens inteiras de alta definição para assinantes pagos, a Codeway usa as GPUs A100 mais poderosas, que geram conteúdo de alta qualidade em menos tempo. Ao usar A10Gs e A100s, a empresa pode cumprir todos os seus contratos de nível de serviço para tempos de produção.

“Sabíamos que as A10Gs eram menos potentes do que as A100s, mas algumas workloads não exigem tanto desempenho de GPU”, diz Arpaci. “Agora, podemos descarregar muitas dessas workloads de nossas GPUs mais poderosas, que agora funcionam somente com recursos para usuários premium, como geração de imagens de alta qualidade.”

Para melhorar ainda mais a eficiência de custos e o desempenho, a Codeway adotou clusters no Amazon Elastic Kubernetes Service (Amazon EKS) — um serviço gerenciado para executar Kubernetes na Nuvem AWS e em datacenters on-premises — para mover dinamicamente as instâncias G5 do Amazon EC2 para cima e para baixo conforme necessário. Uma solução personalizada de escalabilidade automática foi implantada em cada cluster do Amazon EKS, que solicita instâncias adicionais de forma inteligente quando surge a demanda.

Para gerenciar instâncias, a Codeway conta com o Karpenter, uma solução de provisionamento de nós de código aberto. Esse serviço determina e usa efetivamente os tipos de instância apropriados com base nas necessidades da Codeway. “Na verdade, o Karpenter seleciona o número necessário de instâncias para nós e as implanta. Além disso, implantamos a workload necessária”, diz Arpaci. “Todo o processo é automatizado, o que simplifica muitos fatores do ponto de vista operacional.”

Diagrama de arquitetura

Resultado | Reduzindo os custos de computação em 48% para escalar com eficiência a IA generativa

A adoção das GPUs A10G apresentadas nas instâncias G5 do Amazon EC2 tem sido fundamental na jornada da Codeway em direção a uma arquitetura mais econômica, robusta e escalável. A empresa pode escalar com eficácia para atender aos picos e quedas no uso, respondendo às demandas de usuários em todo o mundo. Agora, milhões de usuários do Wonder desfrutam de uma experiência aprimorada com aplicativos e jogos.

“Com as instâncias G5 do Amazon EC2 equipadas com GPUs NVIDIA A10G Tensor Core, podemos processar um grande subconjunto de workloads de inferência de IA”, diz Arpaci. “Ao usar os aceleradores de GPU A10G na AWS, podemos segmentar nossas workloads para oferecer melhor desempenho aos nossos usuários.”

Na AWS, a Codeway mantém alta performance e disponibilidade a um custo ideal. Ao dimensionar corretamente as instâncias G5 do Amazon EC2 e aproveitar as instâncias spot do Amazon EC2, que executam workloads tolerantes a falhas com até 90% de desconto em comparação com os preços sob demanda, a empresa reduziu seus custos de computação em 48% em comparação com a execução de todos os seus workloads em GPUs A100. A versão gratuita do Wonder visa converter usuários em assinantes pagos; ao reduzir os custos de computação da oferta gratuita, a Codeway pode adquirir mais assinantes pela mesma faixa de preço.

No futuro, a Codeway usará os serviços da AWS para permanecer na vanguarda da IA generativa. Ela planeja aprofundar seu envolvimento com a AWS no futuro e adotar novos serviços para alimentar outros componentes de sua infraestrutura. Por exemplo, a Codeway está avaliando vários serviços da AWS, como o AWS Batch — um serviço que facilita o processamento em lote, o treinamento de modelos de machine learning e a análise em grande escala — para padronizar suas workloads de treinamento de IA.

Na AWS, a Codeway fez grandes avanços para produzir com sucesso a IA generativa. Graças a essa jornada transformadora, sua framework de IA adaptável e resiliente está pronta para apoiar sua crescente base de usuários.

Sobre a Codeway

Com sede em Istambul, Turquia, a Codeway lança aplicativos móveis movidos por inteligência artificial generativa e outras tecnologias de ponta. Desde 2020, mais de 140 milhões de usuários em mais de 160 países baixaram seus aplicativos.

Serviços da AWS usados

Amazon EC2

O Amazon Elastic Compute Cloud (Amazon EC2) oferece a plataforma de computação mais ampla e aprofundada, com mais de 700 instâncias e opções de processadores, armazenamentos, redes, sistemas operacionais e modelos de compras mais recentes para ajudar você a atender melhor às necessidades da sua workload.

Saiba mais »

Instâncias G5 do Amazon EC2

As instâncias G5 do Amazon EC2 são a última geração de instâncias baseadas em GPU NVIDIA que podem ser usadas para uma ampla variedade de casos com uso intensivo de elementos gráficos e machine learning.

Saiba mais »

Amazon EKS

O Amazon Elastic Kubernetes Service (Amazon EKS) é um serviço gerenciado do Kubernetes para executar o Kubernetes na Nuvem AWS e em datacenters on-premises.

Saiba mais »

AWS Batch

O AWS Batch permite que desenvolvedores, cientistas e engenheiros executem com eficiência milhares de tarefas de computação em lote e em ML enquanto otimizam recursos computacionais para que você possa se concentrar na análise de resultados e na solução de problemas.

Saiba mais »

Mais histórias de clientes sobre IA generativa

nenhum item encontrado 

1

Comece a usar

Organizações de todos os portes, em todos os setores, estão transformando seus negócios e cumprindo suas missões todos os dias usando a AWS. Entre em contato com nossos especialistas e comece sua própria jornada para a AWS hoje mesmo.