Publicado en: Jul 25, 2023

Amazon SageMaker Canvas ahora admite cinco nuevas transformaciones de datos, lo que le permite preparar y analizar mejor los datos antes de crear modelos de machine learning (ML). Los datos son la base del machine learning y la transformación de los datos sin procesar para que sean adecuados para la creación de modelos de ML y la generación de predicciones es clave para obtener mejores conocimientos. A partir de hoy, SageMaker Canvas le permite cambiar el tipo de datos de las columnas entre numéricos, de texto y de fecha y hora, al mismo tiempo que muestra la característica asociada a ese tipo de datos, como binarios y categóricos. Esto le brinda la flexibilidad de cambiar manualmente el tipo de datos de las columnas en función de las características. La posibilidad de elegir el tipo de datos correcto garantiza la integridad y precisión de los datos antes de crear modelos de ML. Como ejemplo, el uso de un tipo de datos de fecha y hora garantiza que solo se almacenen las fechas válidas en esa columna en particular. 

Además, Canvas le permite volver a muestrear datos de series temporales, estableciendo intervalos regulares para las observaciones en su conjunto de datos de series temporales. Esto es particularmente útil cuando los datos de series temporales contienen observaciones espaciadas irregularmente. El remuestreo de estos datos le ayudará a espaciarlos equitativamente entre los intervalos de tiempo regulares, lo que los hace útiles para las operaciones posteriores, como el análisis y las predicciones. Por último, Canvas ahora ofrece mejores formas de administrar las filas de sus datos, lo que le permite ordenarlas en orden ascendente o descendente, mezclar filas aleatoriamente y eliminar filas duplicadas.

Estas nuevas capacidades de transformación de datos están disponibles en todas las regiones de AWS en donde hoy se admite Canvas. Para obtener más información, consulte la documentación del producto.