Publicado en: Nov 17, 2023
AWS Glue para Apache Spark ahora admite la conectividad nativa con Amazon OpenSearch Service. De esta manera, los usuarios pueden leer y escribir datos de manera eficiente desde Amazon OpenSearch Service sin necesidad de instalar ni administrar bibliotecas de conectores de OpenSearch. Los usuarios ahora pueden usar los datos almacenados en los índices de OpenSearch Service como fuente o destino en la interfaz visual sin código de arrastrar y soltar de AWS Glue Studio, o directamente en un script de trabajo de ETL de AWS Glue. Cuando se combina con las capacidades de extracción, transformación y carga (ETL) de AWS Glue, este nuevo conector simplifica la creación de canalizaciones de ETL. Esto permite a los desarrolladores de ETL ahorrar tiempo en la creación y el mantenimiento de las canalizaciones de datos.
Para empezar, cree una nueva conexión de Amazon OpenSearch Service en el catálogo de datos de AWS Glue y agregue una fuente o un destino de OpenSearch Service a su trabajo de ETL de Glue. Al leer desde OpenSearch Service, los desarrolladores pueden elegir un índice completo de OpenSearch Service como fuente o enviar una consulta para seleccionar datos de índices específicos. Al escribir en OpenSearch Service, los usuarios pueden ampliar, limpiar y transformar los datos en Glue antes de cargar los resultados en un índice de OpenSearch Service. Estas capacidades permiten a los desarrolladores de ETL trabajar con BigQuery y AWS Glue en una variedad de situaciones.
Esta característica está disponible en todas las regiones comerciales de AWS en las que está disponible AWS Glue. Para obtener más información, consulte la documentación de AWS Glue.