Publié le: Aug 4, 2023
Les tâches d'entraînement Amazon SageMaker prennent désormais en charge les instances ml.p5, alimentées par les puces NVIDIA H100, spécialement conçues pour les applications d'apprentissage machine learning haute performance dans le cloud. Vous pouvez utiliser les instances ml.p5 de SageMaker pour entraîner certains des modèles les plus exigeants. Cela inclut les grands modèles de langage (LLM) et les modèles de diffusion qui alimentent les applications d'IA générative les plus exigeantes. Ces applications incluent la réponse aux questions, la génération de code, la génération de vidéos et d'images et la reconnaissance vocale.
Les instances ml.p5 proposent actuellement jusqu'à 8 des derniers GPU NVIDIA H100 Tensor Core. Les instances P5 associent des GPU NVIDIA H100 Tensor Core à des performances de processeur deux fois supérieures, à une mémoire système deux fois plus élevée et à un stockage local quatre fois plus élevé que les instances basées sur des GPU de génération précédente. Ils offrent des capacités évolutives de pointe pour la formation distribuée et les charges de travail HPC étroitement couplées avec un réseau pouvant atteindre 3 200 Gbit/s grâce à la technologie Elastic Fabric Adapter (EFA) de deuxième génération.
Actuellement, l'entraînement de modèle SageMaker prend en charge les instances ml.p5 dans les régions AWS USA Est (Virginie du Nord) et USA Ouest (Oregon) dans la taille ml.p5.48xlarge.
Pour en savoir plus sur les instances ml.p5, visitez la page des instances P5. Pour commencer à utiliser les instances ml.p5, connectez-vous à la console Amazon SageMaker. Pour en savoir plus sur l'entraînement de modèle Amazon SageMaker, visitez notre page web.