Publicado en: Jun 26, 2023
Amazon SageMaker Data Wrangler ahora permite la conexión directa a Snowflake para preparar datos y crear características para machine learning (ML). SageMaker Data Wrangler reduce de semanas a minutos el tiempo necesario para agregar y preparar datos para ML mediante una interfaz visual de Amazon SageMaker Studio.
A partir de hoy, los clientes pueden conectarse a Snowflake desde SageMaker Data Wrangler sin proporcionar una integración del almacenamiento de Amazon Simple Storage Service (Amazon S3) ni administrar copias de datos duraderas en S3. Esta característica reduce el tiempo dedicado a la configuración y simplifica la conexión entre SageMaker Data Wrangler y Snowflake. Esto facilita que sea posible escalar a un gran número de usuarios en toda la organización. Puede explorar bases de datos, tablas, esquemas y consultar datos de Snowflake en SageMaker Data Wrangler y combinarlos con datos de otros orígenes de datos conocidos, como S3, Amazon Athena, Amazon Redshift, Amazon EMR y más de 50 aplicaciones SaaS para crear el conjunto de datos adecuado para ML. Luego, puede comprender rápidamente la calidad de los datos, limpiarlos y crear características con más de 300 análisis y transformaciones de datos integrados mediante la interfaz visual de SageMaker Data Wrangler. También puede entrenar e implementar modelos con el Piloto automático de Amazon SageMaker y automatizar el proceso de preparación de datos en canalizaciones de implementación, entrenamiento o ingeniería de características mediante las Canalizaciones de Amazon SageMaker.
SageMaker Data Wrangler admite la conexión directa a Snowflake sin costo adicional en todas las regiones en las que está habilitado este servicio. Para obtener más información, consulte esta entrada de blog y la documentación técnica de AWS.