Publicado en: Feb 6, 2023

Los rastreadores de AWS Glue permiten a MongoDB extraer el esquema de datos y rellenar automáticamente el catálogo de datos de AWS Glue, que mantiene los metadatos actualizados. Hoy ampliamos la compatibilidad para incluir MongoDB Atlas. Esta función facilita mucho la incorporación de los metadatos gestionados de MongoDB Atlas al catálogo de datos de AWS Glue, de modo que los ingenieros de datos puedan integrar los datos de MongoDB Atlas con los lagos de datos basados en S3 y extraer información importante. 

Con el lanzamiento de hoy, puede crear y programar un Glue Crawler para rastrear MongoDB Atlas. En la consola de Glue Crawler, puede seleccionar MongoDB como fuente de datos. A continuación, puede crear una conexión Glue con el tipo de conexión «DocumentDB/MongoDB» y proporcionar la información y las credenciales del clúster de MongoDB Atlas. Una vez creada la configuración, puede especificar la base de datos y las colecciones de MongoDB Atlas que desea rastrear. Con cada ejecución del rastreador, éste inspecciona la información de colecciones y catálogos especificados. Esto incluye actualizaciones o eliminaciones de colecciones, vistas y vistas materializadas de MongoDB Atlas en el catálogo de datos de AWS Glue. Con AWS Glue, ahora puede utilizar el catálogo de datos de AWS Glue como fuente para extraer datos de MongoDB Atlas y rellenar un destino de Amazon S3.

El soporte de AWS Glue Crawler para MongoDB Atlas suele estar disponible en todas las regiones comerciales en las que AWS Glue está disponible. Para obtener más información, lea el blog y consulte la documentación del rastreador de AWS Glue.