Publicado en: Oct 21, 2022

Hoy, nos complace anunciar la compatibilidad con la programación de trabajos de procesamiento en Amazon SageMaker Data Wrangler. Amazon SageMaker Data Wrangler reduce, de semanas a minutos, el tiempo que se demora en agregar y preparar datos para machine learning (ML). Con SageMaker Data Wrangler, es posible simplificar el proceso de preparación de datos e ingeniería de características, así como completar cada paso del flujo de trabajo de preparación de datos, incluida la selección, limpieza, exploración y visualización de datos en una única interfaz visual. Anteriormente, la programación de un trabajo de procesamiento de datos implicaba la integración con una capacidad informática sin servidor y un servicio de bus de eventos. Este proceso también implicaría escribir código para programar el trabajo de procesamiento de datos en un entorno de producción. Integrar estas diversas capacidades juntas y escribir el código para orquestar este flujo de trabajo puede ser una tarea laboriosa y que requiere mucho tiempo para los científicos de datos, los ingenieros de datos y los ingenieros de ML.

Con la compatibilidad con la programación, ahora puede programar un trabajo de procesamiento de Data Wrangler con unos pocos clics. Los trabajos se pueden programar para que se ejecuten en horas y días específicos de la semana. Las programaciones también se pueden ingresar como expresiones CRON para ofrecer mayor personalización y flexibilidad (por ejemplo, para programar un trabajo que se ejecuta el primer miércoles de un mes calendario). Puede asociar hasta dos programaciones a un trabajo de procesamiento de Data Wrangler. Una vez que se ha ingresado la programación deseada, Data Wrangler muestra una vista previa de las próximas cinco ejecuciones de trabajos para una confirmación adicional. Puede acceder a esta capacidad de programación como parte del flujo de trabajo “Crear trabajo” en Data Wrangler.

Esta característica está disponible en general en todas las regiones de AWS que en este momento admiten Data Wrangler sin costo adicional. Para comenzar a programar sus trabajos de procesamiento de datos con SageMaker Data Wrangler, lea la documentación de AWS.