Témoignages de clients / Logiciels et Internet
AI21 Labs accélère l'adoption de modèles d'IA générative à l'aide d'Amazon SageMaker
Découvrez comment AI21 Labs, leader de l'IA générative et des grands modèles de langage, a rapidement préformé et publié un modèle de 17 milliards de paramètres à l'aide d'Amazon SageMaker.
Moins de 2 mois
du début à la fin du projet
Modèle génératif efficacement préformé
avec 17 milliards de paramètres
Gain de temps pour les ingénieurs
qui peuvent se concentrer sur leurs tâches principales plutôt que sur la configuration de l'infrastructure
Deux tiers des clients
ont rapidement adopté le modèle Grande
Réalisation d'une inférence à faible latence
qui améliore la satisfaction des clients
Présentation
AI21 Labs (AI21), leader de l'intelligence artificielle (IA) générative et des grands modèles de langage (LLM), souhaite fournir aux entreprises des applications de LLM et d'IA de pointe pour créer des solutions d'IA générative. Dans un premier temps, AI21 a publié deux modèles : l'un avec 7 milliards de paramètres et l'autre avec 178 milliards de paramètres. Cependant, l'entreprise a vu l'opportunité de proposer à ses clients un modèle de taille moyenne de 17 milliards de paramètres qui comblait l'écart entre les tailles existantes. Le nouveau modèle de langage préformé préserverait la qualité de la génération de texte, le rendant presque identique au modèle de la plus grande taille, à un coût d'inférence bien inférieur tant pour AI21 que pour ses clients.
Pour créer efficacement ce modèle, AI21 s'est tournée vers Amazon Web Services (AWS) et a formé le modèle de base en moins de 20 jours à l'aide d'Amazon SageMaker, qui crée, forme et déploie des modèles de machine learning (ML) pour presque tous les cas d'utilisation avec une infrastructure, des outils et des flux de travail entièrement gérés.
Opportunité | Utilisation d'Amazon SageMaker pour préformer efficacement un LLM de 17 milliards de paramètres pour AI21
Fondée en 2017, AI21 permet aux entreprises d'accéder à ses modèles de langage propriétaires avec AI21 Studio, que plus de 30 000 développeurs utilisent pour créer leurs propres applications d'IA générative. L'entreprise propose également Wordtune, son assistant d'écriture et de lecture basé sur l'IA, qui aide des dizaines de millions d'utilisateurs dans le monde à interagir avec le langage écrit.
En août 2021, AI21 a publié son modèle de langage Jurassic-1 en deux tailles : le modèle Large, rapide et rentable, compte 7,5 milliards de paramètres, tandis que le modèle Jumbo offre une sortie de texte de meilleure qualité à un coût plus élevé, avec 178 milliards de paramètres. Bien que les modèles de plus grande taille offrent la meilleure qualité, leur utilisation est moins facile et peut s'avérer coûteuse à grande échelle. Pour aider ses clients à optimiser le compromis entre coût et qualité lorsqu'ils opèrent à grande échelle, AI21 a préformé et publié en décembre 2022 son troisième modèle, Grande, qui compte 17 milliards de paramètres, à l'aide d'Amazon SageMaker.
AI21 a rapidement finalisé le projet en moins de 2 mois après son lancement, en prenant moins de 20 jours pour préformer le modèle. Étant donné que les LLM sont d'énormes réseaux neuronaux avec des milliards de paramètres, la formation est un projet complexe et chronophage, qui nécessite d'énormes ressources de calcul. Grâce à Amazon SageMaker, AI21 a pu bénéficier d'un processus de formation de modèle plus simple et plus efficace, et l'entreprise a pu mettre à l'échelle les tâches de formation distribuées sur autant de GPU que nécessaire. « Les architectes de solutions d'AWS étaient réactifs et interactifs, et nous avons pu résoudre les problèmes et terminer le projet dans les délais », explique Dan Padnos, vice-président de Platform chez AI21.
L'entreprise avait déjà utilisé AWS et a choisi Amazon SageMaker en raison de sa rentabilité, de sa simplicité d'utilisation et de sa gestion complète. AI21 pouvait également continuer à utiliser sa pile logicielle de formation existante et être rapidement opérationnelle, ce qui était important au moment où l'entreprise développait ses activités. Pour préformer le modèle Grande en moins de 20 jours, AI21 a dû utiliser 256 GPU A100, répartis sur 32 instances. La formation à grande échelle nécessitait un outil capable d'orchestrer l'attribution des nœuds, de centraliser la journalisation et de réduire la supervision manuelle. « Lorsque vous gérez une mission de formation distribuée de cette envergure, toutes sortes de défis techniques qui peuvent sembler insignifiants ou banals peuvent devenir un véritable casse-tête », explique M. Padnos. « Amazon SageMaker propose des fonctionnalités que vous pouvez utiliser pour gérer cette complexité et réduire la quantité d'efforts que votre équipe doit consacrer aux détails. » Par exemple, Amazon SageMaker propose des fonctionnalités telles que les surveillances de l'état et la journalisation centralisée que les entreprises peuvent utiliser pour améliorer leur efficacité.
Dans la mesure où Amazon SageMaker gère les défaillances des nœuds, redémarre avec élégance et orchestre des exécutions distribuées de grande envergure, l'équipe chargée de la préformation du modèle peut se concentrer sur les tâches principales. »
Dan Padnos
Vice-président de Platform, AI21 Labs
Solution | Réduction de la latence et facilitation de la croissance grâce à un modèle préformé utilisant Amazon SageMaker
Grâce à Amazon SageMaker, AI21 a rapidement publié le nouveau modèle. L'entreprise estime gagner plusieurs semaines par rapport à ses méthodes de formation précédentes. « Dans la mesure où Amazon SageMaker gère les défaillances des nœuds, redémarre avec élégance et orchestre des exécutions distribuées de grande envergure, l'équipe chargée de la préformation du modèle peut se concentrer sur les tâches principales », déclare M. Padnos. « Au lieu de relever des défis techniques, elle peut évaluer les performances du modèle et la progression de la formation. »
Le calendrier accéléré était important, car les capacités du modèle Grande répondent mieux aux besoins de la majorité des clients d'AI21. Les clients ayant des cas d'utilisation destinés aux consommateurs, tels que la rédaction automatique d'e-mails, ont apprécié la migration du modèle Jumbo vers le modèle Grande, car leur grande échelle exige de la rentabilité. Quelques mois seulement après l'introduction du modèle Grande, celui-ci représentait environ les deux tiers du trafic de l'entreprise. « Nous avons constaté une adoption rapide et nous sommes très satisfaits du résultat », poursuit M. Padnos. « Notre expérience concernant l'utilisation d'Amazon SageMaker s'est avérée très positive. Nous avons obtenu le résultat que nous espérions, en respectant les délais, le budget et sans difficulté imprévue. »
L'un des principaux facteurs à prendre en compte pour les applications d'IA génératives est la faible latence d'inférence, car l'expérience utilisateur doit être fluide. Lorsque les utilisateurs rédigent du contenu à l'aide d'un outil tel que Wordtune, ils souhaitent que l'IA leur serve de référence rapide sans pour autant ralentir leur processus de réflexion. Grâce à Amazon SageMaker, AI21 a obtenu une faible latence d'inférence avec le modèle Grande afin de répondre au mieux aux besoins des clients, en réduisant ainsi la latence par quatre pour l'un de ses clients importants. Dès lors, les clients d'AI21 peuvent servir des millions d'utilisateurs au quotidien en temps quasi réel sans nuire à l'expérience utilisateur. « L'un de nos clients majeurs a constaté une amélioration significative des indicateurs de satisfaction des utilisateurs, qu'il attribue à la réduction considérable de la latence lors de la migration du modèle Jumbo vers le modèle Grande », déclare M. Padnos.
La sortie du modèle Grande a également contribué à la croissance d'AI21 et de ses clients. Selon M. Padnos, « Après la publication du modèle Grande, qui a été développé à l'aide d'Amazon SageMaker, nous avons constaté une augmentation de notre trafic global ». « Les clients individuels qui ont migré vers le modèle Grande ont également augmenté leur trafic. »
Résultat | Création de la prochaine génération de LLM à l'aide d'Amazon SageMaker
Le modèle Grande (désormais appelé Mid) est disponible sur Amazon SageMaker JumpStart, un hub de ML avec des algorithmes intégrés, des modèles de base et des solutions de ML prédéfinies que les utilisateurs d'Amazon SageMaker peuvent déployer en quelques clics. Le cycle de vie des données est contenu dans l'environnement d'un utilisateur afin de préserver la confidentialité, et une organisation peut appliquer le modèle de langage à ses données sans écrire de code ni avoir besoin d'un terrain de jeu de code. La série de modèles de base de nouvelle génération d'AI21, Jurassic-2, ainsi que des modèles propres à des tâches sont également disponibles sur Amazon SageMaker JumpStart.
AI21 est enthousiaste quant à l'adoption croissante de l'IA générative dans le monde au cours des mois et des années à venir. À l'aide des services AWS, l'entreprise travaille activement sur des LLM qui seront plus rapides, plus précis, plus fiables et plus rentables. « Nous entretenons de très bonnes relations avec l'équipe AWS », explique M. Padnos. « Les membres de l'équipe ont approfondi les détails techniques avec nous et ont collaboré à des tâches complexes. Tout au long du processus, l'équipe AWS a fait preuve de créativité et a pris conscience de nos défis et de nos objectifs. »
Pour en savoir plus, veuillez consulter https://aws.amazon.com/sagemaker.
À propos d'AI21 Labs
La société de logiciels AI21 Labs donne accès à ses modèles de langage propriétaires permettant aux développeurs de créer des applications d'intelligence artificielle générative, ainsi qu'à son assistant d'écriture et de lecture, Wordtune, qui est optimisé par l'intelligence artificielle.
Services AWS utilisés
Amazon SageMaker
Amazon SageMaker aide les scientifiques des données et les développeurs à préparer, créer, entraîner et déployer rapidement des modèles d'apprentissage automatique (ML) de haute qualité en rassemblant un large éventail de fonctionnalités conçues spécialement pour l'apprentissage automatique.
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart est un centre de machine learning (ML) avec des modèles de base, des algorithmes intégrés et des solutions ML prédéfinies que vous pouvez déployer en quelques clics.
En savoir plus »
Plus de témoignages de clients sur l'IA générative
Démarrer
Les organisations de toutes tailles et de tous secteurs transforment leur activité et exécutent leurs missions au quotidien à l'aide d'AWS. Contactez nos experts et démarrez votre transition vers AWS dès aujourd'hui.