Publié le: Oct 17, 2023

Nous avons le plaisir d'annoncer la préversion des instances ml.p4d, ml.trn1 et ml.g5, dans de nouvelles régions, pour l'inférence asynchrone et en temps réel de modèles de machine learning (ML) sur Amazon SageMaker. Ces instances sont également généralement disponibles dans d'autres régions à des fins d'inférence.

  • Les instances ml.p4d.24xlarge, désormais disponibles en version préliminaire dans les régions AWS GovCloud (US, côte ouest), Europe (Irlande), Asie-Pacifique (Tokyo) et Asie-Pacifique (Singapour), offrent des performances élevées pour les modèles de deep learning. Avec 40 Go de mémoire par GPU Nvidia A100, les instances P4d permettent des inférences de machine learning de haute performance sur de grands modèles et des cas d'utilisation de l'IA générative.
  • Les instances ml.trn1, désormais disponibles en version préliminaire dans l'USA Ouest (Oregon), prennent en charge des charges de travail d'inférence à hautes performances sur plus de 100 milliards de paramètres sur des modèles de deep learning et d'IA générative, couvrant des applications telles que la synthèse de texte, la génération de code et la réponse aux questions.
  • Les instances ml.g5, désormais disponibles en avant-première en Asie-Pacifique (Séoul) et en Amérique du Sud (Sao Paulo), sont idéales pour les cas d'utilisation tels que les recommandations, les chatbots, les assistants intelligents et la reconnaissance d'images.

Pour accéder à ces aperçus, il vous suffit de demander des augmentations de limites via AWS Service Quotas. Pour en savoir plus sur la tarification de ces instances, consultez notre page de tarification. Pour plus d'informations sur le déploiement de modèles avec SageMaker, consultez la présentationici et la documentationici. Pour en savoir plus sur les instances en version préliminaire, consultez la page produit G5, la page produit Trn1 et la page produit P4.