Publicado en: Jun 8, 2021
Amazon SageMaker Data Wrangler reduce el tiempo que tarda agregar y preparar los datos para el aprendizaje automático de semanas a minutos. Con SageMaker Data Wrangler, es posible simplificar el proceso de preparación de datos y la ingeniería de características, así como completar cada paso del flujo de trabajo de preparación de datos, incluida la selección, la limpieza, la exploración y la visualización de datos desde una única interfaz visual. A partir de hoy, puede utilizar Snowflake como origen de datos en Amazon SageMaker Data Wrangler para preparar datos fácilmente en Snowflake para el aprendizaje automático.
Con Snowflake como origen de datos para Amazon SageMaker Data Wrangler, ahora puede conectarse rápidamente y con facilidad a Snowflake sin necesidad de escribir ni una sola línea de código. Además, ahora puede unir sus datos en Snowflake a los datos almacenados en Amazon S3, así como los datos consultados a través de Amazon Athena y Amazon Redshift, para preparar datos para aprendizaje automático. Una vez conectados, puede consultar de forma interactiva los datos almacenados en Snowflake, transformarlos fácilmente con más de 300 transformaciones de datos preconfiguradas, entenderlos e identificar errores potenciales y valores extremos con un conjunto de plantillas de visualización preconfiguradas robustas. También puede identificar rápidamente incoherencias en su flujo de trabajo de preparación de datos y diagnosticar los problemas antes de implementar los modelos en producción. Finalmente, puede exportar su flujo de trabajo de preparación de datos a Amazon S3 para su uso con otras características de SageMaker, como Amazon SageMaker Autopilot, Amazon SageMaker Feature Store y Amazon SageMaker Pipelines.
Para obtener más información sobre la integración de Snowflake con Amazon SageMaker Data Wrangler, consulte el blog. Para comenzar con Amazon SageMaker Data Wrangler, consulte nuestra documentación y nuestra página web.