Publicado en: Sep 8, 2022

Amazon SageMaker Canvas anuncia funcionalidades adicionales para los análisis exploratorios de datos con visualizaciones avanzadas, lo que le permite explorar y analizar mejor sus datos antes de crear los modelos de machine learning. SageMaker Canvas es una interfaz visual interactiva que permite a los analistas empresariales generar predicciones de machine learning precisas por su cuenta, sin necesidad de contar con experiencia en esta tecnología o escribir líneas de código. 

A partir de hoy, Amazon SageMaker Canvas brinda nuevas visualizaciones para los exploratory data analysis (EDA, análisis exploratorios de datos), que le permiten comprender mejor sus datos antes de crear los modelos. Estas visualizaciones se agregan a la variedad de funcionalidades para la preparación y la exploración de los datos que ya ofrece Canvas, como los tamaños flexibles para el muestreo de datos; la imputación de valores faltantes; la sustitución de valores atípicos; el filtrado, la combinación y la modificación de conjuntos de datos; y los formatos de marca temporal ampliados. Las visualizaciones lo ayudan a analizar las relaciones existentes entre las características de sus conjuntos de datos y a asimilar mejor sus datos. Esto se realiza con un formato visual de fácil lectura, con la posibilidad de interactuar con los datos y descubrir información que puede pasar desapercibida en las consultas ad hoc. Pueden crearse rápidamente a través del visualizador de datos dentro de SageMaker Canvas antes de crear y entrenar los modelos de machine learning. Las nuevas visualizaciones incluyen lo siguiente:

  • Gráficos de dispersión: estos gráficos se pueden utilizar para observar las relaciones existentes entre las diferentes variables numéricas de sus datos. Se usan puntos para representar los valores de dos variables numéricas diferentes, donde la posición de cada punto indica el valor de un determinado punto de datos en los ejes vertical y horizontal.
  • Gráficos de barras: estos gráficos se pueden utilizar para resumir un conjunto de datos categóricos representado por barras para una comparación inmediata de los datos. La altura de cada barra representa la proporción de una incorporación específica de los datos.
  • Diagramas de caja: estos diagramas representan grupos de datos numéricos a través de sus cuartiles. Los diagramas de caja lo ayudan a determinar cómo se reparten los valores de sus datos. La vista gráfica representa la distribución de uno o varios grupos de datos numéricos.

Todas las funcionalidades de los EDA, incluidas las nuevas visualizaciones, se admiten en todas las regiones de AWS donde está disponible SageMaker Canvas. Para obtener más información sobre Canvas, las regiones compatibles y cómo comenzar a utilizar el servicio, consulte la documentación de Canvas, la página del producto y la página de preguntas frecuentes.