AWS Glue

Integración de datos simple, escalable y con tecnología sin servidor

AWS Glue es un servicio de integración de datos sin servidores que facilita la detección, preparación y combinación de datos para análisis, machine learning y desarrollo de aplicaciones. AWS Glue proporciona todas las capacidades que se necesitan para la integración de datos, para que pueda comenzar a analizarlos y usarlos en minutos en vez de meses.

La integración de datos es el proceso de preparar y combinar datos para análisis, machine learning y desarrollo de aplicaciones. Involucra varias tareas, como descubrir y extraer datos de diversos orígenes; enriquecer, limpiar, normalizar y combinar datos; y cargar y organizar datos en bases de datos, almacenes de datos y lagos de datos. Normalmente, estas tareas las manejan diferentes tipos de usuarios y cada uno utiliza productos diferentes.

AWS Glue proporciona interfaces visuales y basadas en código para facilitar la integración de datos. Los usuarios pueden encontrar datos y acceder a ellos fácilmente con el catálogo de datos de AWS Glue. Los ingenieros de datos y los desarrolladores de ETL (extracción, trasformación y carga) pueden utilizar AWS Glue Studio para crear, ejecutar y supervisar visualmente flujos de trabajo con unos pocos clics. Los analistas y los científicos de datos pueden utilizar AWS Glue DataBrew para completar, limpiar y normalizar visualmente los datos sin escribir código. Con AWS Glue Elastic Views, los desarrolladores de aplicaciones pueden usar lenguaje de consulta estructurada (SQL) para combinar y replicar datos en diferentes almacenes de datos.

1 millón de objetos almacenados de forma gratuita

Beneficios

Integración de datos más veloz

Diferentes grupos de su organización pueden usar AWS Glue para trabajar juntos en tareas de integración de datos, lo que incluye la extracción, limpieza, normalización, combinación, carga y ejecución de flujos de trabajo de ETL escalables. De este modo, reduce de meses a minutos el tiempo que lleva analizar y usar los datos.

Automatice la integración de datos a escala

AWS Glue automatiza gran parte del esfuerzo necesario para integrar los datos. AWS Glue rastrea sus orígenes de datos, identifica formatos de datos y sugiere esquemas para almacenar los datos. Genera automáticamente el código para ejecutar sus transformaciones de datos y procesos de carga. Puede utilizar AWS Glue para ejecutar y administrar fácilmente miles de trabajos de ETL o para combinar y replicar datos por varios almacenes de datos mediante SQL.

Olvídese de administrar servidores

AWS Glue se ejecuta en un entorno sin servidores. No hay infraestructura que administrar y AWS Glue aprovisiona, configura y escala los recursos necesarios para ejecutar sus trabajos de integración de datos. Solo paga por los recursos que utilizan los trabajos cuando se ejecutan.

Casos de uso


Cree canalizaciones de ETL (extracción, transformación y carga) basadas en eventos

AWS Glue puede ejecutar sus trabajos de ETL a medida que llegan los datos. Por ejemplo, puede usar una función de AWS Lambda para que active sus trabajos de ETL de manera que se ejecuten en cuanto haya una nueva base de datos disponible en Amazon S3. También puede registrar este nuevo conjunto de datos en el catálogo de datos de AWS Glue como parte de sus trabajos de ETL.

Diagrama de canalizaciones de ETL basadas en eventos

Cree un catálogo unificado para encontrar datos en varios almacenes de datos

Puede usar el catálogo de datos de AWS Glue para descubrir y buscar con rapidez en numerosos conjuntos de datos de AWS sin mover los datos. Una vez catalogados, puede realizar búsquedas y consultas inmediatamente con Amazon Athena, Amazon EMR y Amazon Redshift Spectrum.

Cree y ejecute trabajos de ELT en AWS Glue

Cree, ejecute y supervise trabajos de ELT sin codificar

AWS Glue Studio facilita la creación, ejecución y supervisión visual de trabajos de ETL en AWS Glue. Puede componer trabajos de ETL que mueven y transforman datos mediante un editor de arrastrar y soltar, para que AWS Glue genere automáticamente el código. Luego, puede utilizar el panel de ejecución de trabajos de AWS Glue Studio para supervisar la ejecución de ETL y asegurarse de que los trabajos funcionen según lo previsto. Más información sobre AWS Glue Studio aquí.

Herramienta visual de ETL para desarrolladores de ETL

Explore datos con la preparación de datos visuales de autoservicio

AWS Glue DataBrew permite explorar y experimentar con datos directamente desde su lago de datos, almacenes de datos y bases de datos, incluidos Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora y Amazon RDS. Puede elegir entre más de 250 transformaciones prediseñadas en AWS Glue DataBrew para automatizar las tareas de preparación de datos, como filtrar anomalías, estandarizar formatos y corregir valores no válidos. Una vez preparados los datos, puede usarlos de inmediato para análisis y aprendizaje automático. Más información sobre AWS Glue DataBrew aquí.

Limpieza y normalización visual de datos

Cree vistas materializadas para combinar y replicar datos (en versión preliminar)

AWS Glue Elastic Views le permite usar SQL familiar para crear vistas materializadas. Use estas vistas para acceder y combinar datos desde varios almacenes de datos de origen y mantenga esos datos combinados actualizados y accesibles desde un almacén de datos de destino. La versión preliminar de AWS Glue Elastic Views admite Amazon DynamoDB como fuente; próximamente, compatible con Amazon Aurora y Amazon RDS. Los destinos admitidos actualmente son Amazon Redshift, Amazon S3 y Amazon OpenSearch Service (sucesor de Amazon Elasticsearch Service); próximamente, compatible con Amazon Aurora, Amazon RDS y Amazon DynamoDB. Más información sobre AWS Glue Elastic Views aquí.

Limpieza y normalización visual de datos

Novedades

fecha
  • fecha
1
Características de AWS Glue
Consulte las características de AWS Glue

Obtenga más información sobre las características clave de AWS Glue.

Más información 
Regístrese para obtener una cuenta de AWS
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Regístrese 
Comience a crear en la consola
Comience a crear en AWS Glue

Comience a crear con AWS Glue en la interfaz visual de ETL.

Inicie sesión