La gobernanza de tareas ya está disponible de forma general para Amazon SageMaker HyperPod
Amazon SageMaker HyperPod ahora le proporciona una gobernanza centralizado de todas las tareas de desarrollo de IA generativa, como el entrenamiento y la inferencia. Tiene visibilidad y control totales sobre la asignación de recursos informáticos, lo que garantiza que se prioricen las tareas más críticas y maximiza la utilización de los recursos informáticos, lo que reduce los costos de desarrollo de modelos hasta en un 40 %.
Con la gobernanza de tareas de HyperPod, los administradores pueden definir con mayor facilidad las prioridades para las diferentes tareas y establecer límites para la cantidad de recursos informáticos que puede usar cada equipo. En cualquier momento, los administradores también pueden supervisar y auditar las tareas que se están ejecutando o están esperando recursos informáticos a través de un panel visual. Cuando los científicos de datos crean sus tareas, HyperPod las ejecuta automáticamente, respetando los límites y prioridades de los recursos informáticos definidos. Por ejemplo, cuando la capacitación para un modelo de alta prioridad debe completarse lo antes posible, pero todos los recursos informáticos están en uso, HyperPod libera recursos de tareas de menor prioridad para respaldar la capacitación. HyperPod detiene la tarea de baja prioridad, guarda el punto de control y reasigna los recursos informáticos liberados. La tarea de baja prioridad que fue interrumpida se reanudará desde el último punto de control guardado a medida que los recursos vuelvan a estar disponibles. Y cuando un equipo no utiliza plenamente los límites de recursos que el administrador ha establecido, HyperPod usa esos recursos inactivos para acelerar las tareas de otro equipo. Además, HyperPod ahora está integrado con Amazon SageMaker Studio, lo que incorpora la gobernanza de tareas y otras capacidades de HyperPod al entorno de Studio. Los científicos de datos ahora pueden interactuar sin problemas con los clústeres de HyperPod directamente desde Studio, lo que les permite desarrollar, enviar y supervisar trabajos de machine learning (ML) en potentes clústeres respaldados por aceleradores.
La gobernanza de tareas para HyperPod está disponible en todas las regiones de AWS en las que HyperPod está disponible: Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón), Asia Pacífico (Bombay), Asia Pacífico (Singapur), Asia Pacífico (Sídney) y Asia Pacífico (Tokio), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (Estocolmo) y América del Sur (São Paulo).
Para obtener más información, visite la página web de SageMaker HyperPod, el blog de noticias de AWS y la documentación de SageMaker AI.