Publicado en: Nov 1, 2023
Hoy. AWS anuncia la disponibilidad general de los bloques de capacidad de Amazon Elastic Compute Cloud (Amazon EC2). Puede utilizar los bloques de capacidad de EC2 para reservar instancias de GPU en un UltraCluster de Amazon EC2 para una fecha futura durante el tiempo que necesite para ejecutar sus cargas de trabajo de machine learning (ML). Esta es una forma innovadora de reservar capacidad, ya que puede programar instancias de GPU para que estén disponibles en una fecha futura solo durante el tiempo que necesite esas instancias.
Los bloques de capacidad de EC2 le proporcionan un acceso seguro y predecible a las instancias de GPU para sus cargas de trabajo de ML. Además, con los bloques de capacidad de EC2 para ML, obtiene conectividad de baja latencia y alto rendimiento mediante la colocación en UltraClusters de Amazon EC2 para una formación distribuida. Puede reservar la capacidad de la GPU durante entre uno y 14 días y en tamaños de clúster de una a 64 instancias (512 GPU), lo que le brinda la flexibilidad de ejecutar una amplia gama de cargas de trabajo de ML. Esto incluye la capacitación y el ajuste de los modelos de ML, la creación rápida de prototipos y la gestión de los aumentos repentinos de la demanda futura. Los bloques de capacidad de EC2 se pueden reservar con hasta ocho semanas de antelación.
Los bloques de capacidad de EC2 ya están disponibles para reservar instancias P5 de Amazon EC2, equipadas con las GPU NVIDIA H100 Tensor Core más recientes, en la región de AWS del este de EE. UU. (Ohio).
Para comenzar, visite la consola de administración de AWS, la interfaz de línea de comandos (CLI) de AWS y los SDK de AWS. Para obtener más información, consulte Bloques de capacidad de Amazon EC2 para ML y la documentación.