Témoignages de clients/Logiciels et Internet/Turquie
Codeway économise 48 % sur les coûts de calcul liés à l’IA générative grâce aux instances Amazon EC2 G5
Découvrez comment Codeway a optimisé les performances de prix de Wonder, son application d'IA générative, à l'aide des instances Amazon EC2 G5 optimisées par GPU NVIDIA.
Réduction de 48 %
sur les coûts de calcul
1,5 million d'utilisateurs actifs par mois
dans plus de 160 pays
Moins de 3,5 mois
à déployer sur AWS
Simplification
de la gestion opérationnelle
Performance
optimale
Présentation
Grâce à plus de 140 millions d'utilisateurs répartis dans plus de 160 pays, Codeway a eu un impact significatif dans le monde des applications mobiles et des jeux grâce à la puissance de l'intelligence artificielle générative. À mesure que sa base d'utilisateurs augmentait, Codeway a cherché à améliorer la capacité de mise à l'échelle, l'élasticité et la rentabilité des charges de travail qui sous-tendent cette puissante technologie.
Après avoir reçu les recommandations d'Amazon Web Services (AWS), Codeway a choisi d'adopter les instances Amazon Elastic Compute Cloud (Amazon EC2) G5 optimisées par des GPU NVIDIA A10G Tensor Core, des instances hautes performances basées sur des GPU pour le machine learning et les applications gourmandes en ressources graphiques, pour optimiser Wonder, son application de génération d'images. En optimisant l'infrastructure de Wonder sur AWS, Codeway a maintenu des performances optimales, réduit ses coûts par rapport à sa stratégie informatique précédente et s'est développée efficacement pour aider des millions de créateurs de contenu à donner vie à leurs idées.
Opportunité | Augmentation de la capacité de calcul pour l'IA générative tout en réduisant les coûts pour Codeway
Basée à Istanbul, en Turquie, Codeway développe des applications mobiles et des jeux utilisant des technologies de pointe, notamment l'IA générative. Son application Wonder transforme les mots en images numériques ; les utilisateurs saisissent des mots ou des phrases, et Wonder transforme ces entrées en illustrations en déployant des modèles de diffusion stables pour la génération d'images à partir de PyTorch sur AWS. En fonction de leur abonnement, les utilisateurs peuvent ensuite télécharger une version de haute ou de basse qualité de l'image.
Étant donné que Wonder a été téléchargé par plus de 28,3 millions d'utilisateurs, Codeway s'efforce de maximiser ses capacités de calcul et de GPU. L'infrastructure de Wonder est répartie entre différents fournisseurs de services cloud dans plusieurs régions. Pour les charges de travail d'intelligence artificielle (IA), Codeway utilisait des GPU NVIDIA A100 Tensor Core hébergés chez l'un de ces fournisseurs. Cependant, il a rencontré des problèmes de capacité des GPU qui ont affecté les performances.
« Ces charges de travail nécessitent un matériel très gourmand en ressources GPU. Nous ajoutons également des millions d'utilisateurs chaque mois, de sorte que notre demande en GPU ne pourra qu'augmenter », déclare Ugur Arpaci, ingénieur DevOps en chef chez Codeway. « Alors que nous passons de la gestion de centaines de GPU à des milliers, nous voulions optimiser les coûts et les performances et trouver une bonne stratégie en matière de capacité de mise à l'échelle »
Amazon EC2 propose une gamme de solutions informatiques étendue et approfondie, avec plus de 600 instances et un choix de processeurs, de solutions de stockage, de réseaux, de systèmes d'exploitation et de modèles d'achat les plus récents, afin d'aider les clients à répondre au mieux aux exigences de leurs charges de travail. Alors que Codeway cherchait des moyens pour optimiser ses calculs, elle a découvert une solution idéale : les instances Amazon EC2 G5 optimisées par des GPU NVIDIA A10G Tensor Core. Bien que Codeway ait eu le choix entre des GPU similaires à ceux d'autres fournisseurs de services cloud, ils n'offraient pas la même disponibilité et la même capacité de mise à l’échelle qu'AWS.
« L'équipe AWS a suggéré que nous pouvions atteindre nos objectifs en matière de rapport prix-performances en adoptant les instances Amazon EC2 G5 optimisées par des GPU NVIDIA A10G Tensor Core », explique Arpaci. « Nous avons commencé à le tester et nous avons obtenu de bons résultats. »
Sur AWS, nous pouvons segmenter nos charges de travail afin d'améliorer les performances de nos utilisateurs. »
Ugur Arpaci
Ingénieur DevOps en chef, Codeway
Solution | Exécution de modèles de diffusion stables basés sur PyTorch pour Wonder sur AWS dans un délai de 3,5 mois
Après avoir analysé la performance de prix des instances Amazon EC2 G5, Codeway a travaillé en étroite collaboration avec l'équipe d’AWS pour mener à bien le processus d'intégration. « Nous avons toujours été en contact avec les experts d'AWS », explique Arpaci. « Nous avons suivi leurs conseils, puis nous avons effectué des tests et calculé les coûts de notre côté. Pour certains modèles, nous avons réalisé que nous pouvions tirer le meilleur parti du déploiement de notre application sur des instances Amazon EC2 G5. Nous avons ensuite partagé nos résultats et établi une boucle de feedback très positif. »
Le processus d'intégration a été rapide et fluide, et en trois mois et demi, Codeway exécutait des charges de travail de production pour Wonder sur AWS. Il utilise désormais des instances Amazon EC2 G5 avec des GPU A10G pour déployer presque toutes les charges de travail d'IA pour la version gratuite de Wonder. Pour générer des images complètes en haute définition pour les abonnés payants, Codeway utilise les GPU A100 plus puissants, qui génèrent un contenu de meilleure qualité en moins de temps. En utilisant des modèles A10G et A100, l'entreprise peut respecter tous ses accords de niveau de service en matière de délais de production.
« Nous savions que les A10G étaient moins puissants que les A100, mais certaines charges de travail ne nécessitent pas autant de performances GPU », explique Arpaci. « Nous pouvons désormais décharger une grande partie de ces charges de travail à partir de nos GPU plus puissants, qui ne fonctionnent désormais que sur des fonctionnalités utilisateur premium, telles que la génération d'images de haute qualité. »
Pour améliorer encore la rentabilité et les performances, Codeway a adopté des clusters sur Amazon Elastic Kubernetes Service (Amazon EKS), un service géré permettant d'exécuter Kubernetes dans le cloud AWS et dans des centres de données sur site, afin de faire tourner dynamiquement les instances Amazon EC2 G5 vers le haut et vers le bas selon les besoins. Une solution de mise à l’échelle automatique et personnalisée a été déployée sur chaque cluster Amazon EKS, qui demande intelligemment des instances supplémentaires lorsque la demande s'en fait sentir.
Pour gérer les instances, Codeway s'appuie sur Karpenter, une solution open source de provisionnement de nœuds. Ce service détermine et utilise efficacement les types d'instances appropriés en fonction des besoins de Codeway. « En fait, Karpenter sélectionne le nombre d'instances requis pour nous et les déploie, puis nous déployons la charge de travail requise par-dessus ces instances », explique Arpaci. « L'ensemble du processus est automatisé, ce qui simplifie de nombreux facteurs d'un point de vue opérationnel. »
Diagramme d’architecture
Résultat | Réduire les coûts de calcul de 48 % pour faire évoluer efficacement l'IA générative
L'adoption des GPU A10G intégrés aux instances Amazon EC2 G5 a joué un rôle déterminant dans le parcours de Codeway vers une architecture plus rentable, robuste et évolutive. L'entreprise peut évoluer efficacement pour faire face aux pics et aux baisses d'utilisation, en répondant aux demandes des utilisateurs du monde entier. Aujourd'hui, des millions d'utilisateurs de Wonder bénéficient d'une expérience améliorée en matière d'applications et de jeux.
« Grâce aux instances Amazon EC2 G5 optimisées par les GPU NVIDIA A10G Tensor Core, nous pouvons traiter un large sous-ensemble de nos charges de travail d'IA », explique Arpaci. « En utilisant des accélérateurs GPU A10G sur AWS, nous pouvons segmenter nos charges de travail afin d'améliorer les performances de nos utilisateurs. »
Sur AWS, Codeway maintient une haute performance et une meilleure disponibilité à un coût optimal. En redimensionnant les instances Amazon EC2 G5 et en tirant parti des instances Spot Amazon EC2 , qui exécutent des charges de travail tolérantes aux pannes avec une réduction allant jusqu'à 90 % par rapport aux tarifs à la demande, l'entreprise a réduit de 48 % ses coûts de calcul par rapport à l'exécution de toutes ses charges de travail sur des GPU A100. La version gratuite de Wonder a pour but de convertir les utilisateurs en abonnés payants ; en réduisant les coûts de calcul pour l'offre gratuite, Codeway peut acquérir plus d'abonnés au même prix.
À l'avenir, Codeway utilisera les services AWS pour rester à la pointe de l'IA générative. Elle prévoit de renforcer son engagement avec AWS dans le futur et d'adopter de nouveaux services pour alimenter d'autres composants de son infrastructure. Codeway évalue par exemple plusieurs services AWS, tels qu'AWS Batch, un service qui facilite le traitement par lots, la formation de modèles de machine learning et l'analyse à grande échelle, afin de standardiser ses charges de travail de formation à l'IA.
Sur AWS, Codeway a réalisé de grands progrès en matière de production réussie d'IA générative. Grâce à ce parcours de transformation, son cadre d'IA flexible et résilient est prêt à soutenir sa base d'utilisateurs croissante.
À propos de Codeway
Basée à Istanbul, en Turquie, Codeway lance des applications mobiles utilisant l'intelligence artificielle générative et d'autres technologies de pointe. Depuis 2020, plus de 140 millions d'utilisateurs dans plus de 160 pays ont téléchargé ses applications.
Services AWS utilisés
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) offre la plateforme de calcul la plus variée et la plus complète, avec plus de 700 instances. Vous y avez accès au processeur, à la solution de stockage, aux réseaux, au système d'exploitation et au modèle d'achat les plus récents pour vous aider à répondre au mieux aux besoins de votre charge de travail.
Instances Amazon EC2 G5
Les instances Amazon EC2 G5 sont la génération la plus récente d'instances basées sur le processeur graphique NVIDIA et peuvent être utilisées pour un large éventail de cas exigeants en ressources graphiques et en capacités de machine learning.
Amazon EKS
Amazon Elastic Kubernetes Service (Amazon EKS) est un service Kubernetes géré qui vous permet d’exécuter Kubernetes dans le Cloud AWS et dans les centres de données sur site.
AWS Batch
AWS Batch permet aux développeurs, aux scientifiques et aux ingénieurs d'exécuter efficacement des centaines de milliers de tâches de traitement et de calcul de machine learning par lots tout en optimisant les ressources de calcul. Ainsi, vous pouvez vous concentrer sur l'analyse des résultats et la résolution des problèmes.
Plus de témoignages de clients sur l'IA générative
Démarrer
Les organisations de toutes tailles et de tous secteurs transforment leur activité et exécutent leurs missions au quotidien à l'aide d'AWS. Contactez nos experts et démarrez votre transition vers AWS dès aujourd'hui.