Publicado en: Dec 4, 2023
Amazon SageMaker Canvas ahora admite funciones integrales de preparación de datos con la tecnología de Amazon SageMaker Data Wrangler. Ahora puede importar datos tabulares, de series temporales, de imágenes y de texto de más de 50 orígenes de datos, generar informes Data Quality and Insights (Información y calidad de datos) y transformar datos con más de 300 operadores integrados para crear y utilizar modelos de machine learning (ML) sin escribir ningún código. Mediante esta integración, puede acelerar la preparación de datos para ML de semanas a minutos con SageMaker Canvas.
La agregación, el análisis y la transformación de grandes cantidades de datos es fundamental, pero, a menudo, es la parte del flujo de trabajo de ML que consume más tiempo. El cliente ahora puede analizar y visualizar los datos rápidamente para identificar problemas que podrían afectar a la calidad del modelo mediante el informe Data Quality and Insights (Información y calidad de datos), limpiar los datos y crear características para ML mediante más de 300 transformaciones respaldadas por Spark. Ahora los clientes pueden crear un flujo visual de preparación de datos en SageMaker Canvas e importar datos de Amazon S3, Amazon Athena, Amazon Redshift, Salesforce Data Cloud, Snowflake y más de 50 orígenes de datos. Una vez preparados los datos, los clientes pueden escalar los pasos de preparación de los datos para ejecutarlos en trabajos de procesamiento distribuidos de Spark, exportar el conjunto de datos para entrenar modelos o predecir los resultados con modelos básicos y de machine learning listos para usar. Como alternativa, pueden exportar su flujo de trabajo de datos como un paso de una canalización de SageMaker para diseñar características, entrenar modelos o transformar datos casi en tiempo real para su inferencia en SageMaker Studio.
Las nuevas capacidades de preparación de datos están disponibles en todas las regiones de AWS en las que se admite SageMaker Canvas. Para obtener más información, consulte el blog y la documentación técnica de AWS.