Publicado en: Dec 3, 2019
La creación automática de pilotos de Amazon SageMaker ya está disponible en todas partes. Con esta característica, Amazon SageMaker puede usar datos tabulares y la columna de destino que especifique para entrenar y ajustar un modelo automáticamente, al mismo tiempo que se provee una visibilidad completa del proceso. Tal como lo sugiere el nombre, puede utilizarla para la creación automática de pilotos, la implementación del modelo con la más alta precisión con un simple clic en Amazon SageMaker Studio o utilizarla como guía para la toma de decisiones, lo que le permite hacer truques, como precisión por latencia o tamaño del modelo.
A menudo, resulta difícil determinar qué algoritmo de ML funcionará mejor para un determinado conjunto de datos, sin mencionar lo complicado que es encontrar parámetros de algoritmos adecuados. Asimismo, debe eliminar datos o procesarlos previamente para crear buenos modelos de ML. Esto lleva tiempo y, a veces, exige habilidades de aprendizaje automático avanzadas. Estos problemas hacen que los equipos tomen atajos o adopten soluciones alternativas, como utilizar un conjunto de datos tal como está, en lugar de limpiarlo o procesar los datos previamente. Los equipos terminan utilizando el algoritmo que es fácil de usar en vez del algoritmo correcto para el problema existente. Como consecuencia, las empresas se enfrentan con problemas para lograr la calidad del modelo deseada. Asimismo, los científicos de datos con conocimiento integral de ML gastan mucho tiempo probando diferentes modelos de ML antes de encontrar el mejor para un problema en particular, especialmente para aplicaciones como las de servicios de publicidad o IoT, que tienen restricciones de tamaño de modelo y de latencia.
La creación automática de pilotos de Amazon SageMaker simplifica todo este proceso, volviendo más sencillo, rápido y transparente el aprendizaje automático. Ahora puede crear modelos de clasificación y regresión sin conocimiento profundo del aprendizaje automático: simplemente, proporcione un conjunto de datos tabular y seleccione la columna objetivo por predecir, y la creación automática de pilotos de Amazon SageMaker explorará automáticamente las soluciones de aprendizaje automático con diferentes combinaciones de preprocesadores de datos, algoritmos y configuraciones de parámetros del algoritmo para encontrar el modelo más adecuado. En lugar de pedirle que decida qué algoritmo usar, la creación automática de pilotos de Amazon SageMaker selecciona automáticamente el algoritmo correcto de una lista de algoritmos de alto rendimiento que admite de manera nativa y los evalúa a todos. La creación automática de pilotos de Amazon SageMaker también prueba automáticamente diferentes configuraciones de parámetros en los algoritmos para obtener la mejor calidad del modelo. Ahora puede implementar directamente el mejor modelo para la producción con un solo clic o evaluar varios candidatos para compensar métricas como la precisión, la latencia y el tamaño del modelo. No se debe preocupar por la limpieza y el procesamiento previo de los datos, ya que la creación automática de pilotos de Amazon SageMaker aplica diferentes tipos de preprocesadores de datos sobre los datos antes de pasárselos a los algoritmos para entrenar modelos.
La creación automática de pilotos de Amazon SageMaker ya está disponible en las siguientes regiones de AWS: EE.UU. Este (Ohio), EE.UU. Este (Norte de Virginia), EE.UU. Oeste (Norte de California), EE.UU. Oeste (Oregón), Asia Pacífico (Mumbai), Asia Pacífico (Seúl), Asia Pacífico (Singapur), Asia Pacífico (Sídney), Asia Pacífico (Tokio), Canadá (Central), UE (Fráncfort), UE (Irlanda), UE (Londres), UE (París) y UE Estocolmo. Visite la página de documentación para obtener más información sobre la creación automática de pilotos de Amazon SageMaker y lea las publicaciones del blog para aprender a usar la creación automática de pilotos de Amazon SageMaker para sus tareas de creación de modelos.