Publicado en: Mar 30, 2021

AWS Gluees un servicio de integración de datos sin servidores que facilita la detección, preparación y combinación de datos para análisis, machine learning y desarrollo de aplicaciones. Al usar AWS Glue Workflows, puede orquestar y ejecutar un complejo flujo de trabajo de integración de datos con varias tareas y múltiples rastreadores. Los proyectos personalizados de AWS Glue facilitan a los ingenieros de datos la creación de flujos de trabajo de AWS Glue repetibles.

Antes de comenzar con el proyecto de AWS Glue, debe identificar un flujo de trabajo de integración de datos repetible. Por ejemplo: un flujo de trabajo ETL que convierte datos CSV en un bucket de S3 sin formato a formato parquet en un bucket de S3 de producción, cuando se desea ejecutar este flujo de trabajo ETL varias veces en diferentes cuentas de AWS. En lugar de crear un flujo de trabajo para cada proceso ETL, puede crear y registrar un proyecto de AWS Glue que acepte el bucket de S3 como parámetro de entrada. Un analista de datos simplemente necesita proveer parámetros de entrada (por ejemplo: orígenes de datos y objetivos) para crear nuevos flujos de trabajo de integración.

La vista previa pública del proyecto de AWS Glue está disponible en todas las regiones en las que se ofrece AWS Glue. Para obtener más información, visite la Guía del usuario de AWS Glue. Acceda a la consola de AWS Glue para empezar.