Publicado en: Oct 6, 2021
Amazon SageMaker Data Wrangler reduce el tiempo que tarda agregar y preparar los datos para el machine learning (ML) de semanas a minutos. Con SageMaker Data Wrangler, es posible simplificar el proceso de preparación de datos y la ingeniería de características, así como completar cada paso del flujo de trabajo de preparación de datos, incluida la selección, la limpieza, la exploración y la visualización de datos desde una única interfaz visual.
A partir de hoy, puede utilizar las nuevas capacidades de Amazon SageMaker Data Wrangler que ayudan a facilitar y agilizar la preparación de datos para ML, incluidas una nueva colección de transformaciones de series temporales y dos nuevas visualizaciones de series temporales para generar con rapidez información de sus datos de serie temporal. Las nuevas transformaciones de serie temporal admiten imputaciones de valores que faltan, caracterización de series temporales (p. ej., coeficientes de Fourier, estadísticas de autocorrelación, entropía, etc.), resampleo de operadores para reducir o aumentar el muestreo de conjuntos de datos a una frecuencia uniforme, características de desfase temporal y funciones de ventana que permite desplazarse. Las nuevas transformaciones también son compatibles con operaciones más generales, como agrupamiento, unificación de longitud, aplanamiento y exportación de columnas valoradas vectorialmente.
Además, ahora puede visualizar la estacionalidad y las tendencias de sus datos e identificar anomalías con nuevas visualizaciones de series temporales en Amazon SageMaker Data Wrangler. Por ejemplo, con la visualización de estacionalidad y tendencias, puede separar efectos estacionales de las tendencias en sus datos de ventas. Además, con la visualización de detección de valores atípicos, puede identificar valores atípicos dentro de sus conjuntos de datos de compras de clientes para detectar cambios en el comportamiento de compras de los clientes.
Para empezar a utilizar las nuevas capacidades de Amazon SageMaker Data Wrangler, puede abrir Amazon SageMaker Studio tras actualizar a la versión más reciente y hacer clic en Archivo > Nuevo > Flujo en el menú o en “new data flow” (nuevo flujo de datos) en el lanzador de SageMaker Studio. Para obtener más información sobre las nuevas transformaciones de serie temporal y visualizaciones, consulte la documentación.