Publicado en: Aug 9, 2022
El ajuste automático de modelos de Amazon SageMaker ahora admite la especificación de varios tipos de instancias de entrenamiento de SageMaker alternativos para hacer que los trabajos de ajuste sean más sólidos cuando el tipo de instancia preferido no está disponible debido a capacidad insuficiente.
El ajuste automático de modelos de Amazon SageMaker encuentra la mejor versión de un modelo mediante la ejecución de muchos trabajos de entrenamiento en el conjunto de datos utilizando los intervalos específicos de hiperparámetros que usted proporciona para su algoritmo. Luego, elige los valores de hiperparámetros óptimos que dan como resultado un modelo que funciona mejor, según lo evaluado por una métrica que usted elija.
Anteriormente, al crear trabajos de ajuste automático de modelos de SageMaker, solo podía definir un tipo de instancia de entrenamiento en este servicio. Si la capacidad para este tipo de instancia fuera baja, enfrentaría un mayor tiempo de ejecución del trabajo y altas posibilidades de errores en el ajuste del trabajo. Esto era particularmente indeseable, ya que el ajuste de hiperparámetros implica la ejecución de varios trabajos de entrenamiento y, potencialmente, de larga duración, que tendrían que reiniciarse desde cero en caso de dichos errores. Con este lanzamiento, ahora puede especificar hasta 5 tipos de instancias alternativas adicionales en el orden de su preferencia para que el trabajo de ajuste de hiperparámetros pueda recurrir automáticamente al siguiente tipo de instancia alternativa en caso de capacidad insuficiente. Esto hace que los trabajos de ajuste sean flexibles en caso de capacidad insuficiente y le permite ajustar sus modelos sin que aumente el tiempo de ejecución ni haya errores debido a la baja disponibilidad de algunas instancias de entrenamiento específicas de SageMaker.
La capacidad para especificar varios tipos de instancias alternativas en el ajuste automático de modelos de Amazon SageMaker ahora está disponible en todas las regiones comerciales de AWS. Para obtener más información, lea la guía de referencia de la API y la documentación técnica.