Comment Hugging Face aide les entreprises à adopter des modèles ouverts
par l’équipe éditoriale d’AWS | 21 février 2025 | Leadership intellectuel
Présentation
Les modèles de fondation (FM) open source se sont accélérés à une vitesse vertigineuse au cours de la dernière année et demie, rattrapant rapidement leurs homologues des modèles fermés. Les ingénieurs ont désormais plus d’un million de modèles disponibles gratuitement à portée de main, dont beaucoup offrent des performances comparables à celles des meilleurs modèles fermés disponibles. Autrefois réservée aux particuliers, l’utilisation de modèles ouverts s’étend désormais aux entreprises, y compris aux entreprises du Fortune 500.
Cette bibliothèque publique de modèles est prisée par la communauté, car elle permet de contrôler les coûts, d’utiliser des jeux de données transparents et d’accéder à des modèles spécialisés. Mais si tout le monde peut utiliser librement des modèles open source, les défis liés à la mise en production ont freiné le potentiel. Pour un ingénieur expérimenté en machine learning (ML), le processus demande au moins une semaine de travail intensif et implique plusieurs décisions complexes concernant les unités de traitement graphique (GPU), le système dorsal et le déploiement.
Dans le but de rendre l’IA accessible à tous, Hugging Face, une plateforme open source de premier plan, fait tomber ces barrières. Comme l’explique Jeff Boudier, responsable des produits chez Hugging Face, « Notre objectif est de permettre à chaque entreprise du monde de créer sa propre IA ». En lançant récemment Hugging Face Generative AI Services (également surnommé HUGS), l’entreprise s’attaque à la tâche fastidieuse et délicate que représente le déploiement d’un modèle ouvert de production complet.

Modèles ouverts, directement opérationnels
La grande vision de Hugging Face à ses débuts était de « permettre à n’importe qui d’avoir une conversation amusante avec un modèle de machine learning », comme le dit M. Boudier. Cette ambition était peut-être audacieuse en 2016, mais l’entreprise concrétise cette vision aujourd’hui en mettent le déploiement de technologies de pointe à la disposition des particuliers et des entreprises.
Auparavant, les entreprises élaboraient des démonstrations de faisabilité à l’aide de modèles fermés, non pas parce que c’était leur premier choix, mais parce que c’était la solution la plus rapide et la plus simple. Le développement d’une application d’IA à l’aide de modèles ouverts implique généralement de nombreux essais et erreurs, car les ingénieurs s’occupent de tout, de la configuration à la compilation. Pour répondre aux exigences de performances et de conformité, ils doivent ajuster les bibliothèques, les versions et les paramètres.
Grâce à HUGS, les entreprises peuvent éviter les problèmes liés au développement d’une application d’IA avec des modèles ouverts. La solution prête à l’emploi change la donne pour ceux qui cherchent à tirer parti de l’avantage que procure l’IA générative. Aucune configuration n’est nécessaire, ce qui signifie qu’ils peuvent simplement prendre un modèle ouvert et l’utiliser. Ce qui prenait auparavant des semaines ne prend plus que quelques minutes, car les modèles sont automatiquement optimisés pour le GPU ou l’accélérateur d’IA.
Des performances élevées sans restrictions budgétaires
Tout au long du parcours de Hugging Face vers la démocratisation de l’IA, sa collaboration avec AWS l’a aidée à passer du statut de start-up en phase de démarrage à celui de leader du secteur grâce à des modèles d’IA utilisés par des millions de personnes chaque mois. Alors que ces modèles continuent de progresser et que les entreprises recherchent de plus en plus leurs avantages, HUGS leur donne accès à une collection triée sur le volet et évaluée manuellement des grands modèles de langage (LLM) les plus performants et les plus récents.
La collaboration la plus récente de Hugging Face avec Amazon Web Services (AWS) signifie que les entreprises n’ont plus à faire de compromis entre les coûts, les performances et la rapidité de déploiement. Maintenant que la solution est disponible sur les puces d’IA AWS Inferentia2, les développeurs peuvent optimiser davantage les performances des modèles pour réduire la latence et augmenter le débit, tout en économisant jusqu’à 40 % sur les coûts d’inférence. Et ce n’est pas la seule façon de rendre les applications d’IA générative plus accessibles aux entreprises de toutes tailles. En travaillant ensemble sur la bibliothèque Optimum Neuron open source, les entreprises bénéficient des avantages de HUGS tout en minimisant les frais généraux.
Renforcement de l’impact commercial
Qu’il s’agisse de créer des assistants virtuels ou de créer du contenu captivant en quelques secondes, les modèles de Hugging Face couvrent une multitude de cas d’utilisation. Bien que ces modèles soient performants par rapport aux critères académiques, M. Boudier affirme que la personnalisation peut être encore plus intéressante : « Ce qui compte pour votre cas d’utilisation est différent. Grâce à l’optimisation et à l’apprentissage par renforcement, vous pouvez améliorer les modèles ouverts et les rendre bien plus performants que les modèles fermés. »
Grâce à AWS Inferentia2 sur Amazon SageMaker, les modèles Hugging Face peuvent être personnalisés afin d’améliorer la qualité des modèles pour des tâches spécifiques et de permettre des charges de travail de production à grande échelle. La solution permet également aux développeurs d’avoir un impact immédiat lorsqu’ils améliorent les modèles à l’aide de diverses techniques, notamment l’ingénierie de requête, la génération à enrichissement contextuel (RAG), etc.
Les grandes entreprises telles que Thomson Reuters mettent déjà à l’échelle de manière sécurisée et efficace des modèles ouverts sur AWS. Grâce à HUGS et AWS Inferentia2, l’entreprise dispose du matériel optimisé pour créer rapidement et en toute confiance des applications d’IA générative, et ainsi en tirer parti plus rapidement. Disponible sur AWS Marketplace et grâce à une intégration fluide de l’infrastructure AWS, les développeurs peuvent facilement trouver des modèles ouverts, s’y abonner et les déployer selon leurs conditions.
Alors que Hugging Face s’efforce de rendre les modèles ouverts viables pour tous, l’entreprise étend les LLM disponibles via HUGS afin de maintenir les applications de ses clients à la pointe de la technologie. En proposant davantage d’options open source et en simplifiant l’utilisation, les entreprises ont désormais la liberté de choisir entre des modèles ouverts et fermés.
Avez-vous trouvé ce que vous recherchiez aujourd’hui ?
Faites-le nous savoir afin que nous puissions améliorer la qualité du contenu de nos pages.