Publicado en: Aug 21, 2023
Amazon SageMaker Data Wrangler ahora admite los puntos de acceso de S3 para previsualizar e importar datos a SageMaker Data Wrangler y como destino para los datos exportados desde SageMaker Data Wrangler. La preparación de datos de alta calidad para machine learning (ML) suele ser compleja y lleva mucho tiempo, ya que requiere agregar datos en varios orígenes y formatos con diferentes herramientas. Con SageMaker Data Wrangler, puede explorar e importar datos de diferentes fuentes populares, como Amazon S3, Amazon Athena, Amazon Redshift, Snowflake, Databricks y más de 40 orígenes de datos de SaaS. Los clientes utilizan cada vez más Amazon S3 para almacenar conjuntos de datos compartidos, donde diferentes aplicaciones, equipos e individuos acceden a los datos. Los puntos de acceso de S3 permiten a las organizaciones conceder un control de acceso detallado a un nivel granular. En lugar de modificar una política de bucket único, las organizaciones pueden crear varios puntos de acceso con políticas individuales adaptadas a casos de uso específicos, lo que reduce el riesgo de errores de configuración o de acceso no deseado a los datos confidenciales. A partir de hoy, SageMaker Data Wrangler facilita a los clientes la preparación de datos a partir de conjuntos de datos compartidos almacenados en S3, al tiempo que permite a las organizaciones controlar de forma segura el acceso a los datos locales.
Una vez que se importan los datos, puede comprender rápidamente la calidad de los datos, limpiarlos y crear características con más de 300 análisis y transformaciones de datos integrados. También puede entrenar e implementar los modelos con el Piloto automático de SageMaker y poner en funcionamiento el proceso de preparación de datos en una canalización de ingeniería, entrenamiento o implementación de características mediante la integración con la canalización de SageMaker desde SageMaker Data Wrangler.
SageMaker Data Wrangler es compatible con los puntos de acceso de Amazon S3 en todas las regiones que actualmente admiten Data Wrangler. Para obtener más información, visite la documentación técnica de AWS.