Publicado en: Aug 24, 2023

Nos complace anunciar una versión preliminar de Amazon SageMaker Profiler, una herramienta de observabilidad avanzada para grandes cargas de trabajo de deep learning. Con esta nueva capacidad, podrá acceder a información detallada sobre la creación de perfiles relacionados con el hardware de cómputo para optimizar el rendimiento del entrenamiento de los modelos.

Para los clientes que desarrollan grandes modelos de deep learning para casos de uso de la visión artificial, el NLP o los modelos básicos, la cantidad de instancias de cómputo necesarias y los costos asociados son significativos. Necesitan visibilidad de los tiempos del kernel activo, la latencia de ejecución u otros plazos relacionados con los procesos de la GPU/CPU. SageMaker Profiler permite identificar oportunidades de optimización mediante métricas de uso y diagramas de rastreo de GPU/CPU de alta resolución, anotaciones personalizadas y visibilidad del uso de precisión combinado. Permite a los usuarios identificar los cuellos de botella debido a la utilización desigual de los recursos. También es más eficiente para reducir los gastos generales durante el entrenamiento, escalable para admitir una mayor duración de la creación de perfiles y un mayor número de instancias de entrenamiento perfiladas por carga de trabajo. Esto ayuda a proporcionar información más fiable a los científicos de datos mientras se intenta optimizar el rendimiento del hardware para cargas de trabajo de entrenamiento distribuidas a gran escala.

Amazon SageMaker Profiler está disponible en las siguientes regiones: Este de EE. UU. (Ohio), Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón), Europa (Fráncfort) y Europa (Irlanda) mediante la compatibilidad predeterminada de las instancias de cómputo. Durante esta versión preliminar, SageMaker Profiler estará disponible sin costo alguno para los clientes de las regiones admitidas. 

Para obtener más información, consulte el blog y la página de la documentación de ML.