Publicado en: Sep 29, 2022
Amazon SageMaker Canvas ahora admite funciones matemáticas y operadores lógicos para una exploración de datos enriquecida, lo que hace posible definir nuevas características en sus datos. SageMaker Canvas es un servicio visual interactivo que permite a los analistas empresariales generar predicciones de machine learning precisas por su cuenta, sin la necesidad de contar con experiencia en esta tecnología ni de escribir líneas de código.
SageMaker Canvas admite una serie de transformaciones de datos para filtrar, unir y modificar conjuntos de datos, además de visualizaciones avanzadas para comprender las relaciones entre las variables de los datos. A partir de hoy, puede utilizar funciones matemáticas y operadores lógicos con las transformaciones de datos para entender mejor la distribución de los datos antes de diseñar modelos de machine learning (ML). Los resultados obtenidos a partir de las funciones y los operadores le permiten crear nuevas características que se pueden visualizar para atributos específicos. Las funciones matemáticas admitidas incluyen cálculos de adición, sustracción, multiplicación, división, promedios, desviaciones estándares, variaciones, exponentes y logaritmos. Además, SageMaker Canvas es compatible con operadores lógicos, como las instrucciones if-then-else (si-entonces-si no), para definir condiciones específicas. Este servicio le da la flexibilidad necesaria para una mejor comprensión, distribución y exploración de los datos.
Con esta nueva capacidad, SageMaker Canvas permite aplicar la discretización (binning), una técnica que se utiliza para el preprocesamiento. La discretización es un método para agrupar valores numéricos o categoriales relacionados en un número más pequeño de conjuntos llamados “contenedores” (bins). Por ejemplo, si tiene un conjunto de datos que hace un seguimiento de artículos de mueblería, los puede agrupar en contenedores diferentes, como muebles para oficinas, salas de estar o recámaras. La discretización es útil para identificar valores atípicos o no válidos y reduce la no linealidad en los conjuntos de datos, lo que mejora la precisión de los modelos de ML.
La capacidad de definir nuevas características mediante funciones matemáticas y operadores lógicos, así como usar estas características para distribuir los datos en contenedores lógicos separados, ahora está disponible en las mismas regiones de AWS que las de SageMaker Canvas. Para obtener más información sobre SageMaker Canvas y comenzar a utilizarlo, consulte la página del producto y la documentación técnica.