Amazon SageMaker lance l'inférence de modèles multi-adaptateurs

Publié le: 25 nov. 2024

Amazon SageMaker présente aujourd'hui de nouvelles fonctionnalités d'inférence multi-adaptateurs qui offrent des possibilités intéressantes aux clients à l'aide de modèles de langage pré-entraînés. Cette fonctionnalité vous permet de déployer des centaines d'adaptateurs de modèle LoRa (Low-Rank Adaptation) affinés derrière un seul point de terminaison, en chargeant dynamiquement les adaptateurs appropriés en millisecondes en fonction de la demande. Cela vous permet d'héberger efficacement de nombreux adaptateurs LoRa spécialisés basés sur un modèle de base commun, offrant un débit élevé et des économies par rapport au déploiement de modèles distincts.

Grâce à l'inférence multi-adaptateurs, vous pouvez rapidement personnaliser des modèles pré-entraînés pour répondre aux divers besoins de l'entreprise. Par exemple, les entreprises de marketing et de SaaS peuvent personnaliser les applications d'IA/ML en utilisant les images, le style de communication et les documents uniques de chaque client pour générer un contenu personnalisé en quelques secondes. De même, les entreprises de secteurs tels que la santé et les services financiers peuvent réutiliser un modèle de base commun alimenté par LoRA pour effectuer diverses tâches spécialisées, du diagnostic médical à la détection des fraudes, en échangeant simplement l'adaptateur affiné approprié. Cette flexibilité et cette efficacité ouvrent de nouvelles opportunités pour déployer une IA puissante et adaptable au sein de votre organisation.

La fonctionnalité d’inférence multi-adaptateurs est généralement disponible dans les pays suivants : Asie-Pacifique (Tokyo, Séoul, Mumbai, Singapour, Sydney, Jakarta), Canada (Centre), Europe (Francfort, Stockholm, Irlande, Londres), Moyen-Orient (Émirats arabes unis), Amérique du Sud (Sao Paulo), USA Est (Virginie du Nord, Ohio) et USA Ouest (Oregon).

Pour en savoir plus sur l'utilisation de LoRa et la gestion des adaptateurs de modèles et commencer, consultez le Guide du développeur d’Amazon SageMaker.