Publié le: Feb 1, 2024
Amazon Web Services annonce aujourd'hui que les Blocs de capacité d’Amazon Elastic Compute Cloud (Amazon EC2) pour le machine learning prennent désormais en charge les instances P5 dans la région USA Est (Virginie du Nord) et les instances P4d dans les régions USA Est (Ohio) et USA Ouest (Oregon). Vous pouvez utiliser les blocs de capacité EC2 pour réserver des instances GPU très recherchées dans Amazon EC2 UltraClusters pour une date ultérieure, pendant la durée dont vous aurez besoin pour exécuter vos charges de travail de machine learning (ML).
Les blocs de capacité EC2 vous permettent de réserver la capacité du GPU jusqu'à huit semaines à l'avance pour des durées allant de un à 14 jours dans des clusters de une à 64 instances (512 GPU), ce qui vous donne la flexibilité nécessaire pour exécuter un large éventail de charges de travail de machine learning. Ils sont idéaux pour la pré-formation de courte durée et le réglage précis des charges de travail, le prototypage rapide et pour gérer les pics de demande d'inférence. Les blocs de capacité EC2 fournissent une connectivité à faible latence et à haut débit grâce à la colocalisation dans Amazon EC2 UltraClusters.
Grâce à cette extension, les blocs de capacité EC2 pour le machine learning sont disponibles pour les types d'instances et les régions AWS suivants : instances P5 dans l'est des États-Unis (Virginie du Nord) et dans l'est des États-Unis (Ohio) ; instances P4d dans l'est des États-Unis (Ohio) et l'ouest des États-Unis (Oregon).
Pour commencer, accédez à la console de gestion AWS, à l'Interface de la ligne de commande AWS (AWS CLI) et aux kits SDK AWS. Pour en savoir plus, consultez le guide de l'utilisateur des blocs de capacité d'Amazon EC2pour le machine learning.