Publicado en: Dec 14, 2022

Hoy nos complace anunciar el lanzamiento de visualizaciones a nivel de característica generadas automáticamente en Amazon SageMaker Data Wrangler. Amazon SageMaker Data Wrangler reduce, de semanas a minutos, el tiempo que se demora en agregar y preparar datos para machine learning (ML). Con Data Wrangler, podrá simplificar el proceso de preparación de datos e ingeniería de características, y podrá completar cada paso del flujo de trabajo de preparación de datos, incluida la selección, limpieza, exploración y visualización de datos en una única interfaz visual. Data Wrangler ofrece una variedad de opciones de visualización configurables, desde visualizaciones de datos generales, como histogramas, gráficos de dispersión o resumen de tablas, hasta visualizaciones avanzadas, como la detección de anomalías o la descomposición de tendencias estacionales para datos de series temporales, la fuga de datos y el sesgo de funciones para las necesidades de machine learning. 

A partir de hoy, SageMaker Data Wrangler genera automáticamente visualizaciones para cada característica del conjunto de datos. Verá estas visualizaciones en la parte superior de cada columna del conjunto de datos después de importarlo. Esta automatización reduce aún más las cargas pesadas indiferenciadas para los científicos de datos al generar automáticamente información relacionada con la distribución de los datos y la calidad de los datos a nivel de característica. 

Con las visualizaciones generadas automáticamente, puede obtener inmediatamente información relacionada con las distribuciones y los tipos de datos sin escribir ni una sola línea de código. La información lo ayuda a detectar fácilmente problemas de calidad de los datos, como valores atípicos, valores faltantes o no válidos, etc., para cada columna del conjunto de datos. Además, también puede pasar el cursor sobre las visualizaciones para ver estadísticas detalladas, como el recuento y el porcentaje.  

Esta característica en general está disponible y se activa de forma automática en todas las regiones de AWS que en este momento admiten Data Wrangler sin costo adicional. Para obtener más información, consulte el Blog de novedades de AWS y la documentación de SageMaker JumpStart.