Integración de datos sin servidor: AWS Glue, Amazon Web Services

AWS Glue

Descubra, prepare e integre todos sus datos a cualquier escala

Comience a utilizar AWS Glue

¿Por qué usar AWS Glue?

El primer paso de un proyecto de análisis o IA consiste en preparar los datos para obtener resultados de calidad. AWS Glue es un servicio sin servidor que vuelve más fácil, rápido y barato el proceso de integración de datos. Puede detectar y conectarse a más de 100 orígenes de datos, administrar los datos en un catálogo centralizado y crear, ejecutar y supervisar visualmente canalizaciones para cargarlos en lagos de datos, almacenes de datos y almacenes tipo lago. Con las capacidades integradas de IA generativa, puede modernizar los trabajos de Apache Spark y desarrollar con mayor rapidez y asistencia inteligente para la creación de ETL y la resolución de problemas en Spark.

Integre los datos en AWS Glue en la última generación de Amazon SageMaker

Con AWS Glue en la última generación de Amazon SageMaker, puede administrar y crear las cargas de trabajo en un solo lugar con una integración de datos rentable, escalable y sin servidor.

Más información

Beneficios

AWS Glue ofrece todas las capacidades necesarias para la integración de datos, lo que permite obtener información y aprovechar los datos con mayor rapidez. AWS Glue ofrece un conjunto de herramientas sin servidor y completamente administrado para diseñar y automatizar canalizaciones de datos modernas, con ETL, detección de esquemas e integración entre servicios.

AWS Glue escala automáticamente hasta los trabajos de procesamiento de datos más exigentes y con gran consumo de recursos, desde gigabytes hasta petabytes, sin necesidad de administrar infraestructura y sin pagar por recursos que no utiliza.

AWS Glue elimina la necesidad de administrar infraestructura al ofrecer canalizaciones de datos sin servidor con funcionalidades integradas de programación y supervisión, lo que permite a los equipos enfocarse en crear flujos de trabajo de datos en lugar de mantener servidores.

Obtenga ayuda basada en inteligencia artificial durante todo el proceso de integración de datos, desde la generación automática de código ETL hasta la modernización de los trabajos de Spark. AWS Glue proporciona generación de código inteligente, actualizaciones de Spark asistidas por IA y solución de problemas de Spark integrada.

Integre los datos, dondequiera que se encuentren, con una conectividad rápida y sencilla en orígenes de datos en la última generación de Amazon SageMaker. Cree un proyecto de procesamiento de datos con una combinación de AWS Glue, Amazon Athena, Amazon EMR y MWAA (todo dentro de Amazon SageMaker) y benefíciese de una experiencia compartida de administración y supervisión. Las capacidades de procesamiento de datos de AWS Glue están disponibles en los blocs de notas de Amazon SageMaker y en la ETL visual de Amazon SageMaker.

Casos de uso

Simplifique la administración de canalizaciones de ETL

Deje atrás la administración de la infraestructura con el aprovisionamiento automático y la administración de los trabajadores, y unifique todas las necesidades de integración de datos en un único servicio.

Obtenga más información sobre el escalamiento automático de AWS Glue

Explore, experimente y procese los datos de manera interactiva

Al usar las sesiones interactivas de AWS Glue, los ingenieros de datos pueden explorar y preparar datos de manera interactiva desde el entorno de desarrollo integrado (IDE) o el bloc de notas de su preferencia.

Obtenga más información sobre las sesiones interactivas de AWS Glue

Detecte datos de manera efectiva

Identifique rápidamente los datos en AWS, en las instalaciones y en otras nubes y póngalos de inmediato a disposición para consultarlos y transformarlos.

Obtenga más información sobre el Catálogo de datos de AWS Glue

Admita varios marcos y cargas de trabajo de procesamiento

Admita con mayor facilidad diversos marcos de procesamiento de datos, como ETL y ELT, así como distintas cargas de trabajo, incluidas las tareas por lotes, microlotes y streaming.

Obtenga más información sobre los trabajos de ETL de streaming