Publié le: Nov 1, 2023
AWS annonce la disponibilité générale des blocs de capacité pour le ML Amazon Elastic Compute Cloud (Amazon EC2). Les blocs de capacité EC2 vous permettent de réserver des instances GPU dans un UltraCluster Amazon EC2 jusqu'à une certaine date, pendant toute la durée requise pour exécuter vos charges de travail de machine learning (ML). Il s'agit d'une méthode innovante de réserve de capacité : la disponibilité des instances GPU est programmée pour une date ultérieure, et ce, tant qu'elles restent nécessaires.
Les blocs de capacité EC2 vous offrent un accès sûr et prévisible aux instances GPU de vos charges de travail de ML. Avec les blocs de capacité Amazon EC2 pour le ML, vous bénéficiez également d'une connectivité à faible latence et à haut débit grâce à la colocalisation dans des UltraClusters Amazon EC2, qui permet un apprentissage distribué. Vous pouvez réserver de la capacité GPU pour une durée comprise entre un et 14 jours et dans des clusters comprenant une à 64 instances (512 GPU), ce qui vous donne la flexibilité nécessaire pour exécuter un large éventail de charges de travail de ML : entraînement et mise au point de modèles de ML, prototypage rapide et gestion des pics de demande à venir. Les blocs de capacité EC2 peuvent être réservés huit semaines à l'avance maximum.
Les blocs de capacité EC2 sont désormais disponibles pour réserver des instances Amazon EC2 P5, comportant les derniers GPU NVIDIA H100 Tensor Core, dans la région AWS USA Est (Ohio).
Pour commencer, accédez à la console de gestion AWS, à l'Interface de la ligne de commande AWS (AWS CLI) et aux kits SDK AWS. Pour en savoir plus, consultez la section Blocs de capacité Amazon EC2 pour le ML et la documentation.