AWS Glue

Descubra, prepare e integre todos os seus dados em qualquer escala

Um milhão de objetos armazenados gratuitamente

Como funciona

O AWS Glue é um serviço de integração de dados com tecnologia sem servidor que facilita a descoberta, preparação, movimentação e integração de dados de várias fontes para análise, machine learning (ML) e desenvolvimento de aplicações.

  • ETL orientado por eventos
  • O AWS Glue pode executar seus trabalhos de extração, transformação e carregamento (ETL) à medida que chegam novos dados. Por exemplo, é possível configurar o AWS Glue para iniciar trabalhos de ETL a serem executados assim que novos dados estão disponíveis no Amazon Simple Storage Service (S3).

    Diagrama mostrando como o AWS Glue pode executar trabalhos de ETL à medida que novos dados chegam.
  • Catálogo de Dados do AWS Glue
  • Você pode usar o catálogo de dados para descobrir e pesquisar rapidamente diversos conjuntos de dados da AWS sem mover os dados. Quando são catalogados, os dados são disponibilizados imediatamente para pesquisa e consulta por meio do Amazon Athena, do Amazon EMR e do Amazon Redshift Spectrum.

    O diagrama mostra o Data Catalog descobrindo e pesquisando conjuntos de dados sem migrar os dados.
  • Trabalhos de ETL sem código
  • O AWS Glue Studio torna mais fácil criar, executar e monitorar visualmente os trabalhos ETL do AWS Glue. Você pode criar trabalhos ETL que migram e transformam os dados usando um editor do tipo arrastar e soltar, e o AWS Glue gera automaticamente o código.

    O diagrama mostra como os usuários podem compor tarefas de ETL que migram e transformam dados usando um editor de arrastar e soltar.
  • Preparação de dados de autoatendimento
  • Com o AWS Glue DataBrew, é possível explorar e experimentar dados diretamente de seu data lake, data warehouses e bancos de dados, incluindo o Amazon S3, o Amazon Redshift, o AWS Lake Formation, o Amazon Aurora e o Amazon Relacional Database Service (RDS). Escolha entre mais de 250 transformações predefinidas no DataBrew para automatizar tarefas de preparação de dados, como filtragem de anomalias, padronização de formatos e correção de valores inválidos.

    O diagrama mostra como o DataBrew automatiza as tarefas de preparação de dados para os usuários.
Introduction to AWS Glue (Introdução ao AWS Glue) (01:54)
O que é o AWS Glue?
Preparar seus dados para obter resultados de qualidade é a primeira etapa de um projeto de análise ou ML. O AWS Glue é um serviço de integração de dados com tecnologia sem servidor que torna a preparação de dados mais simples, rápida e barata. Você pode descobrir e se conectar a mais de 70 fontes de dados diversas, gerenciar seus dados em um catálogo de dados centralizado e criar, executar e monitorar visualmente pipelines ETL para carregar dados em seus data lakes.

Casos de uso

Simplifique o desenvolvimento de pipeline ETL

Remova o gerenciamento de infraestrutura com provisionamento automático e gerenciamento de funcionários e consolide todas as suas necessidades de integração de dados em um único serviço.

Saiba mais sobre o Auto Scaling do AWS Glue »

Descubra dados de forma eficiente

Identifique dados rapidamente em vários conjuntos de dados da AWS e disponibilize-os instantaneamente para consulta e transformação.

Saiba mais sobre o Catálogo de Dados do AWS Glue »

Explore, experimente e processe dados de forma interativa

Ao usar sessões interativas do AWS Glue, os engenheiros de dados podem explorar e preparar dados de forma interativa usando o ambiente de desenvolvimento integrado (IDE) ou o caderno de sua escolha.

Saiba mais sobre as sessões interativas do AWS Glue »

Suporte a várias estruturas de processamento e workloads

Suporte mais fácil a várias estruturas de processamento de dados, como ETL e ELT, e várias workloads, incluindo batch, microbatch e streaming.

Saiba mais sobre streaming de jobs de ETL »

Como começar

Experimente o AWS Glue gratuitamente

Descubra, prepare, mova e integre dados de várias fontes com a facilidade de um ambiente com tecnologia sem servidor.

Criar com o AWS Glue

Saiba como criar pipelines de dados com a interface visual ETL do AWS Glue Studio.

Integre seus dados

Acompanhe para configurar e começar a usar o AWS Glue.


Veja mais sobre a AWS