Publicado en: Jul 8, 2022

Hoy, nos complace anunciar que los experimentos del piloto automático de Amazon SageMaker se ejecutan hasta 2 veces más rápido para generar modelos ML con un alto rendimiento. El piloto automático de Amazon SageMaker es un producto de machine learning de código bajo que crea, entrena y ajusta automáticamente los mejores modelos de ML en función de sus datos, a la vez que le permite mantener el control y la visibilidad completos. No obstante, a medida que crece el conjunto de datos, los modelos de entrenamiento y ajuste puede llegar a ser costoso desde el punto de vista informático. 

A partir de hoy, el piloto automático SageMaker utilizará un método de inicialización de hiperparámetro de cero disparos e instancias ml.m5.12xlarge (48 CPU virtuales, memoria de 192 GiB) que ayudan a reducir de 250 a 100 la cantidad de pruebas predeterminadas necesarias. Como resultado, el experimento del Piloto automático SageMaker entregará hasta 2 veces más rápido el mejor rendimiento de modelo de ML. Para evaluar las mejoras de desempeño, utilizamos varios conjuntos de datos de referencia OpenML con tamaños que varían entre 0,5 MB a 1 GB. Basados en nuestros resultados, los conjuntos de datos más chicos (< 100MB) vieron una mejora general del tiempo de ejecución del piloto automático de hasta un 45 % (de 230 a 120 minutos promedio) mientras que en el conjunto de datos mediano (> 100MB < 1GB) y grande (> 1GB) se observaron mejoras de un 40 % (de 540 a 430 minutos promedio) en el tiempo de ejecución respectivamente. Con estas mejoras , puede ejecutar más rápido sus experimentos con Piloto automático de SageMaker sin hacer ningún cambio en las configuraciones de trabajo que ya existen.