Publié le: Oct 17, 2023
Nous avons le plaisir d'annoncer la disponibilité générale des instances ml.p4d, en Asie-Pacifique (Tokyo) et en Europe (Francfort), afin de déployer des modèles de machine learning (ML) pour l'inférence asynchrone et en temps réel sur Amazon SageMaker.
Les instances ml.p4d.24xlarge offrent des performances élevées pour les modèles de deep learning. Avec 40 Go de mémoire par GPU Nvidia A100, les instances P4d permettent des inférences de machine learning à hautes performances sur de grands modèles et une IA générative dans des applications telles que le traitement du langage naturel, la détection d'objets et les moteurs de recommandation.
Les utilisateurs peuvent commencer à déployer des modèles à des fins d'inférence sur des instances ml.p4d en Asie-Pacifique (Tokyo) et en Europe (Francfort) sur SageMaker immédiatement. Pour en savoir plus sur la tarification de ces instances, consultez notre page de tarification. Pour plus d'informations sur le déploiement de modèles avec SageMaker, consultez la présentationici et la documentationici. Pour en savoir plus sur les instances p4d, consultez la page produit P4.