SageMaker HyperPod ahora admite la asignación de cuotas detalladas de los recursos de computación
La gobernanza de tareas de SageMaker HyperPod ahora admite la asignación de cuotas de computación detalladas de la memoria de la GPU, el acelerador Trainium, la vCPU y la memoria de vCPU dentro de una instancia. Los administradores pueden asignar cuotas de procesamiento detalladas entre los equipos, lo que optimiza la distribución de los recursos de computación y se mantiene dentro del presupuesto.
Los científicos de datos suelen ejecutar tareas de LLM, como el entrenamiento o la inferencia, que no requieren instancias completas de HyperPod, lo que lleva a la subutilización de los recursos de computación acelerada. La gobernanza de tareas de HyperPod permite que los administradores gestionen la asignación de cuotas de computación entre los equipos. Con esta capacidad, los administradores ahora pueden asignar estratégicamente los recursos de computación. Así, se garantiza un acceso justo, se evita la monopolización de los recursos y se maximiza la utilización de los clústeres. Esta capacidad permite una asignación de cuotas de computación detalladas, además de la asignación a nivel de instancia, en consonancia con las demandas de carga de trabajo de la organización.
La gobernanza de tareas de SageMaker HyperPod está disponible en todas las regiones de AWS en las que HyperPod está disponible: este de EE. UU. (norte de Virginia), oeste de EE. UU. (norte de California), oeste de EE. UU. (Oregón), Asia-Pacífico (Mumbai), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney) y Asia-Pacífico (Tokio), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (Estocolmo) y América del Sur (São Paulo).
Para obtener más información, visite la página web de HyperPod de SageMaker y la documentación de gobernanza de tareas de HyperPod.