Testimonianze dei clienti / Software e Internet / Turchia
Codeway risparmia il 48% sui costi di calcolo per l'IA generativa utilizzando le istanze G5 di Amazon EC2
Scopri come Codeway ha ottimizzato le prestazioni dei prezzi per la sua applicazione di IA generativa, Wonder, utilizzando le istanze G5 di Amazon EC2 basate sulla GPU NVIDIA.
Riduzione del 48%
nei costi di calcolo
1,5 milioni di utenti mensili attivi
in più di 160 paesi
Meno di 3,5 mesi
per distribuire su AWS
Ottimizzazione
della gestione operativa
Prestazioni
ottimali
Panoramica
Con oltre 140 milioni di utenti in più di 160 paesi, Codeway ha avuto un impatto significativo nel mondo delle applicazioni e dei giochi mobili grazie alla potenza dell'intelligenza artificiale generativa. Con la graduale crescita del suo bacino di utenti, Codeway ha cercato di migliorare la scalabilità, l'elasticità e l'efficienza dei costi dei carichi di lavoro alla base di questa potente tecnologia.
Dopo aver ricevuto consigli da Amazon Web Services (AWS), Codeway ha scelto di adottare le istanze G5 di Amazon Elastic Compute Cloud (Amazon EC2) basate sulle GPU NVIDIA A10G Tensor Core, istanze basate su GPU ad alte prestazioni per applicazioni di machine learning e grafiche, al fine di alimentare la sua app di generazione di immagini, Wonder. Ottimizzando l'infrastruttura di Wonder su AWS, Codeway ha mantenuto prestazioni ottimali, ridotto i costi rispetto alla sua precedente strategia di calcolo e ha effettuato il dimensionamento in modo efficace per aiutare milioni di creatori di contenuti a dare vita alle proprie idee.
Opportunità | Dimensionamento del calcolo per l'IA generativa riducendo al contempo i costi per Codeway
Con sede a Istanbul, in Turchia, Codeway sviluppa applicazioni e giochi mobili basati su tecnologie all'avanguardia, in particolare l'IA generativa. La sua applicazione Wonder trasforma le parole in immagini digitali: gli utenti inseriscono parole o frasi e Wonder trasforma quegli input in grafica implementando modelli di diffusione stabili per la generazione delle immagini basati su PyTorch su AWS. A seconda dell'abbonamento, gli utenti possono quindi scaricare una versione dell'immagine di alta o di bassa qualità.
Poiché Wonder è stato scaricato da oltre 28,3 milioni di utenti, Codeway si impegna a massimizzare le sue capacità di elaborazione e GPU. L'infrastruttura di Wonder è distribuita tra vari provider cloud in diverse regioni. Per i carichi di lavoro di inferenza con Intelligenza Artificiale (IA), Codeway utilizzava GPU di NVIDIA A100 Tensor Core con hosting su uno di questi provider. Tuttavia, riscontrava problemi di capacità della GPU che influivano sulle prestazioni.
“Questi carichi di lavoro richiedono hardware a uso intensivo di GPU. Inoltre, si aggiungono milioni di utenti ogni mese, quindi la nostra domanda di GPU non farà che aumentare”, afferma Ugur Arpaci, ingegnere DevOps responsabile di Codeway. “Nel passaggio dalla gestione di centinaia di GPU a migliaia, volevamo ottimizzare costi e prestazioni e trovare una buona strategia per la scalabilità.”
Amazon EC2 offre un portafoglio di calcolo ampio e completo, con oltre 600 istanze e una scelta tra le opzioni più recenti in termini di processore, sistemi di archiviazione, rete, sistema operativo e modello di acquisto, per aiutare i clienti a soddisfare al meglio le esigenze dei loro carichi di lavoro. Mentre Codeway era alla ricerca di modi per ottimizzare il calcolo, ha scoperto una soluzione ideale: le istanze G5 di Amazon EC2 basate su GPU Tensor Core NVIDIA A10G. Sebbene Codeway avesse la possibilità di scegliere tra GPU simili con altri provider cloud, questi non offrivano la stessa disponibilità e scalabilità di AWS.
“Il team AWS ci ha suggerito di raggiungere i nostri obiettivi di rapporto prezzo/prestazioni adottando le istanze G5 di Amazon EC2 basate su GPU Tensor Core NVIDIA A10G”, afferma Arpaci. “Abbiamo iniziato a testarlo e abbiamo osservato buoni risultati.”
Su AWS, possiamo segmentare i nostri carichi di lavoro per fornire prestazioni migliori ai nostri utenti.”
Ugur Arpaci
Lead DevOps Engineer, Codeway
Soluzione | Esecuzione di modelli di diffusione stabile basati su PyTorch per Wonder su AWS entro 3,5 mesi
Dopo aver analizzato le prestazioni dei prezzi delle istanze G5 di Amazon EC2, Codeway ha lavorato a stretto contatto con il team AWS per completare il processo di onboarding. “Siamo sempre stati in contatto con gli esperti di AWS,” afferma Arpaci. “Abbiamo seguito le loro indicazioni e abbiamo quindi eseguito test e calcolato i costi per la parte che ci riguarda. Per alcuni modelli, ci siamo resi conto che avremmo potuto ottenere vantaggi maggiori implementando la nostra applicazione su istanze G5 di Amazon EC2. Abbiamo quindi condiviso i nostri risultati e stabilito un ciclo di feedback molto positivo.”
Il processo di onboarding è stato rapido e senza intoppi e nel giro di 3,5 mesi Codeway eseguiva i carichi di lavoro di produzione per Wonder su AWS. Utilizza ora le istanze G5 di Amazon EC2 con GPU A10G per distribuire quasi tutti i carichi di lavoro di inferenza IA per la versione gratuita di Wonder. Per generare immagini complete ad alta definizione per gli abbonati a pagamento, Codeway utilizza le più potenti GPU A100, che generano contenuti di qualità superiore in un lasso di tempo più breve. Utilizzando le GPU A10G e A100, l'azienda può rispettare tutti i suoi accordi sui livelli di servizio per i tempi di produzione.
“Sapevamo che gli A10G erano meno potenti degli A100, ma alcuni carichi di lavoro non richiedono prestazioni della GPU altrettanto alte,” afferma Arpaci. “Possiamo finalmente scaricare molti di questi carichi di lavoro dalle nostre GPU più potenti, che funzionano ora solo su funzionalità utente premium, come la generazione di immagini di alta qualità.”
Per migliorare ulteriormente l'efficienza dei costi e le prestazioni, Codeway ha adottato i cluster su Amazon Elastic Kubernetes Service (Amazon EKS), un servizio gestito per eseguire Kubernetes nel cloud AWS e nei data center on-premise, per attivare e disattivare dinamicamente le istanze G5 di Amazon EC2 in base alle esigenze. È stata implementata una soluzione di scalabilità automatica personalizzata su ogni cluster Amazon EKS, che richiede in modo intelligente istanze aggiuntive quando si presenta la domanda.
Per gestire le istanze, Codeway si affida a Karpenter, una soluzione open source per il provisioning dei nodi. Questo servizio determina e utilizza efficacemente i tipi di istanza appropriati in base alle esigenze di Codeway. “Karpenter seleziona effettivamente il numero richiesto di istanze per noi e le implementa, mentre noi distribuiamo in aggiunta il carico di lavoro richiesto”, afferma Arpaci. “L'intero processo è automatizzato, il che semplifica molti aspetti dal punto di vista operativo.”
Diagramma di architettura
Risultato | Ridurre i costi di calcolo del 48% per dimensionare efficacemente l'IA generativa
L'adozione delle GPU A10G presenti nelle istanze G5 di Amazon EC2 è stata determinante nel percorso di Codeway verso un'architettura più solida, scalabile ed efficiente in termini di costi. L'azienda è in grado di dimensionare efficacemente per soddisfare picchi e cali di utilizzo, rispondendo alle richieste degli utenti di tutto il mondo. Milioni di utenti Wonder godono ora di un'esperienza migliorata con applicazioni e giochi.
“Con le istanze G5 di Amazon EC2 basate sulle GPU NVIDIA A10G Tensor Core, possiamo elaborare un ampio sottoinsieme dei nostri carichi di lavoro di inferenza AI,” afferma Arpaci. “Utilizzando gli acceleratori di GPU A10G su AWS, possiamo segmentare i nostri carichi di lavoro per fornire prestazioni migliori ai nostri utenti.”
Su AWS, Codeway mantiene prestazioni e disponibilità elevate a un costo ottimale. Applicando il giusto dimensionamento alle istanze G5 di Amazon EC2 e sfruttando le istanze spot di Amazon EC2, che eseguono carichi di lavoro con tolleranza ai guasti fino al 90% in meno rispetto ai prezzi on demand, l'azienda ha ridotto i costi di calcolo del 48% rispetto all'esecuzione di tutti i suoi carichi di lavoro su GPU A100. La versione gratuita di Wonder punta a convertire gli utenti in abbonati a pagamento; riducendo i costi di calcolo per l'offerta gratuita, Codeway può acquisire un maggior numero di abbonati allo stesso prezzo.
In prospettiva futura, Codeway utilizzerà i servizi AWS per restare all'avanguardia nell'IA generativa. Prevede di approfondire il suo impegno con AWS in futuro e di adottare nuovi servizi per alimentare altri componenti della sua infrastruttura. Ad esempio, Codeway sta valutando diversi servizi AWS, come AWS Batch, un servizio che facilita l'elaborazione in batch, l'addestramento di modelli di machine learning e l'analisi su larga scala, per standardizzare i carichi di lavoro di formazione dell'IA.
In AWS, Codeway ha fatto grandi progressi verso la riuscita trasformazione in prodotto dell'IA generativa. Grazie a questo percorso di trasformazione, il suo framework di IA adattabile e resiliente è pronto a supportare il suo crescente bacino di utenti.
Informazioni su Codeway
Con sede a Istanbul, in Turchia, Codeway realizza e commercializza applicazioni mobili basate sull'intelligenza artificiale generativa e altre tecnologie all'avanguardia. Dal 2020, oltre 140 milioni di utenti in più di 160 paesi hanno scaricato le sue applicazioni.
Servizi AWS utilizzati
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) offre la piattaforma di elaborazione più ampia e approfondita, con oltre 700 istanze e la selezione dei più recenti processori, sistemi di archiviazione, reti, sistemi operativi e modelli di acquisto per aiutarti a soddisfare al meglio le esigenze del tuo carico di lavoro.
Istanze G5 di Amazon EC2
Le istanze G5 di Amazon EC2 sono la generazione più recente di istanze basate su GPU NVIDIA che possono essere utilizzate per un'ampia gamma di casi d'uso di grafica intensiva e machine learning.
Amazon EKS
Amazon Elastic Kubernetes Service (Amazon EKS) è un servizio Kubernetes gestito per eseguire Kubernetes nel cloud AWS e sui data center on-premise.
AWS Batch
Batch AWS permette a sviluppatori, scienziati e ingegneri di eseguire in modo efficiente centinaia di migliaia di lavori di batch e ML computing, ottimizzando le risorse di calcolo, in modo da potersi concentrare sull'analisi dei risultati e sulla risoluzione dei problemi.
Altre testimonianze dei clienti relative all'IA generativa
Inizia
Organizzazioni di tutte le dimensioni in tutti i settori trasformano il proprio business e realizzano le loro missioni ogni giorno utilizzando AWS. Contatta i nostri esperti e inizia subito il tuo percorso verso il cloud AWS.