Amazon SageMaker Canvas ahora admite la importación de flujos de datos y una preparación más rápida de los datos para ML
Amazon SageMaker Data Wrangler en Amazon SageMaker Canvas ahora admite la importación de flujos de datos desde Amazon SageMaker Studio Classic, así como una preparación de datos más rápida y flexible para el machine learning (ML). Con la versión más reciente de SageMaker Data Wrangler en SageMaker Canvas, ahora puede importar datos desde S3 más fácilmente con delimitadores personalizados y más opciones de muestreo, y preparar los datos con un rendimiento optimizado. Además, puede validar las transformaciones con mayor rapidez e iterar fácilmente las recetas de datos. También puede importar flujos de datos desde SageMaker Studio Classic para aprovechar las características y mejoras de preparación de datos más recientes en SageMaker Canvas.
La agregación, el análisis y la transformación de grandes cantidades de datos es la parte que consume más tiempo de un proyecto de ML porque es un proceso altamente iterativo y repetitivo. Con estas nuevas mejoras, puede importar datos con diferentes métodos de muestreo, como top-k, aleatorios o estratificados, y ajustar el tamaño y el método de la muestra según sea necesario para obtener una muestra representativa. Puede transformar los datos con una latencia más baja, validar rápidamente el impacto de las transformaciones en el tamaño de los datos y reordenar los pasos según sea necesario. Además, puede copiar una receta de datos y reemplazar los orígenes de datos para reutilizarla en diferentes conjuntos de datos y modelos. Por último, pero no por ello menos importante, puede importar con un solo clic todos los flujos de datos existentes, desde SageMaker Data Wrangler en SageMaker Studio Classic a SageMaker Canvas, o importar manualmente flujos de datos específicos mediante las cargas de archivos locales o de S3.
Estas capacidades mejoradas de preparación de datos están disponibles en todas las regiones de AWS en las que se admite SageMaker Canvas. Para obtener más información, consulte el blog y la documentación técnica de AWS.