Publicado en: May 10, 2023

El Piloto automático de Amazon SageMaker, un servicio de machine learning (ML) con poco código que crea, entrena y ajusta automáticamente los mejores modelos de ML, ahora admite el entrenamiento con métricas objetivas ponderadas en modo Ensemble (Conjunto) y también admite ocho métricas objetivas adicionales. La asignación de ponderaciones a cada muestra de datos del conjunto de datos de entrenamiento puede mejorar el rendimiento general del modelo al ayudarlo a aprender mejor, reducir el sesgo hacia una clase en particular y aumentar la estabilidad. 

Cuando se entrena con conjuntos de datos desequilibrados, en los que algunas clases tienen significativamente menos muestras que otras, se les asignan mayores ponderaciones para ayudar al modelo a aprender mejor y reducir el sesgo hacia las clases mayoritarias. A partir de hoy, puede incluir el nombre de una columna de ponderación en su conjunto de datos de entrada, mientras que crea un experimento de Piloto automático. El Piloto automático de SageMaker utilizará estos valores de ponderación para obtener más información sobre el conjunto de datos y aplicar los aprendizajes mientras se entrena el modelo de ML. 

El Piloto automático de SageMaker ahora también admite ocho métricas objetivas adicionales, como RMSE (raíz del error cuadrático medio), MAE (error absoluto medio), R2 (R cuadrado), Balanced Accuracy (Exactitud equilibrada), Precision (Precisión), Precision Macro (Precisión macro), Recall (Exhaustividad) y Recall Macro (Exhaustividad macro) (documentadas aquí). La métrica objetiva seleccionada se optimiza durante el entrenamiento para lograr la mejor estimación de los valores de los parámetros del modelo a partir de los datos. Si no especifica una métrica de forma explícita, el comportamiento predeterminado es utilizar automáticamente MSE (error cuadrático medio) para la regresión, F1 para la clasificación binaria y Accuracy (Exactitud) para la clasificación multiclase.

Para empezar, cree un experimento de Piloto automático de SageMaker en la consola de SageMaker Studio. Actualice para obtener la versión más reciente de SageMaker Studio y utilizar la nueva característica de columnas de ponderaciones de muestras y un conjunto adicional de métricas objetivas. Para obtener más información, consulte la guía para desarrolladores y la página del producto.