AWS Glue

Integração de dados simples, escalável e sem servidor

O AWS Glue é um serviço de integração de dados sem servidor que facilita descobrir, preparar e combinar dados para análise, machine learning e desenvolvimento de aplicações. O AWS Glue oferece todos os recursos necessários para a integração dos dados, e assim é possível começar a analisar seus dados e usá-los em minutos, em vez de meses.

A integração de dados é o processo de preparar e combinar os dados para análise, machine learning e desenvolvimento de aplicações. Envolve diversas tarefas, como descobrir e extrair dados de várias fontes; enriquecer, limpar, normalizar e combinar dados; carregar e organizar dados em bancos de dados, data warehouses e data lakes. Muitas vezes essas tarefas são lidadas por diferentes usuários que usam produtos diferentes.

O AWS Glue proporciona interfaces visuais e baseadas em código para facilitar a preparação dos dados. Os usuários podem encontrar e acessar facilmente os dados usando o catálogos de dados do AWS Glue. Engenheiros de dados e desenvolvedores de ETL (extrair, transformar e carregar) podem criar, executar e monitorar visualmente fluxos de trabalho ETL com apenas alguns cliques no AWS Glue Studio. Analistas e cientistas de dados podem usar o AWS Glue DataBrew para enriquecer, limpar e normalizar visualmente os dados sem escrever código. Com o AWS Glue Elastic Views, os desenvolvedores de aplicações podem usar um SQL (Structured Query Language) familiar para combinar e replicar os dados em diferentes armazenamentos de dados.

Um milhão de objetos armazenados gratuitamente

Benefícios

Integração de dados mais rápida

Grupos distintos em sua organização podem usar o AWS Glue para trabalhar juntos nas tarefas de integração dos dados, incluindo extração, limpeza, normalização, combinação, carregamento e execução de fluxos de trabalho ETL escaláveis. Desse modo, você reduz o tempo gasto para analisar os dados e usá-los em minutos, não em meses.

Automatize sua integração dos dados em escala

O AWS Glue automatiza grande parte do esforço necessário para a integração dos dados. O AWS Glue percorre suas fontes de dados, identifica os formatos de dados e sugere esquemas para armazenar seus dados. Ele gera o código automaticamente para executar seus processos de transformações e carregamento de dados. Você pode usar o AWS Glue para executar e gerenciar facilmente milhares de trabalhos ETL ou combinar e replicar dados em vários armazenamentos de dados usando SQL.

Não há servidores para gerenciar

O AWS Glue é executado em um ambiente sem servidor. Sem infraestrutura para gerenciar, o AWS Glue provisiona, configura e escala os recursos necessários para executar seus trabalhos de integração dos dados. Você só paga pelos recursos usados durante a execução dos trabalhos.

Casos de uso


Crie pipelines ETL (extrair, transformar e carregar) controlados por eventos

O AWS Glue pode executar seus trabalhos ETL à medida que chegam novos dados. Por exemplo, você pode usar uma função do AWS Lambda para acionar a execução de seus trabalhos ETL assim que novos dados sejam disponibilizados no Amazon S3. Também é possível registrar esse novo conjunto de dados no Catálogo de dados do AWS Glue como parte das tarefas de ETL.

Diagrama de pipelines ETL controlados por eventos

Crie um catálogo unificado para localizar dados em vários armazenamentos de dados

É possível usar o catálogo de dados do AWS Glue para descobrir e pesquisar rapidamente vários conjuntos de dados da AWS sem migrar os dados. Quando são catalogados, os dados são disponibilizados imediatamente para pesquisa e consulta por meio do Amazon Athena, do Amazon EMR e do Amazon Redshift Spectrum.

Crie e execute os trabalhos ELT no AWS Glue

Crie, execute e monitore os trabalhos ETL sem codificar

Com o AWS Glue Studio, é fácil criar, executar e monitorar visualmente os trabalhos ETL do AWS Glue. Você pode compor os trabalhos ETL que migram e transformam os dados usando um editor do tipo arrastar e soltar, e o AWS Glue gera automaticamente o código. É possível usar o painel de execução de trabalhos do AWS Glue Studio para monitorar a execução ETL e garantir que seus trabalhos funcionem como pretendido. Saiba mais sobre o AWS Glue Studio aqui.

Ferramenta visual de ETL para desenvolvedores de ETL

Explore os dados com a preparação visual de dados de autoatendimento

O AWS Glue DataBrew permite explorar e experimentar dados diretamente de seu data lake, data warehouses e bancos de dados, incluindo o Amazon S3, o Amazon Redshift, o AWS Lake Formation, o Amazon Aurora e o Amazon RDS. Escolha entre mais de 250 transformações predefinidas no AWS Glue DataBrew para automatizar tarefas de preparação de dados, como filtragem de anomalias, padronização de formatos e correção de valores inválidos. Depois de preparar os dados, você poderá usá-los imediatamente para análise e machine learning. Saiba mais sobre o AWS Glue DataBrew aqui.

Limpeza visual de dados e normalização de dados

Crie exibições materializadas para combinar e replicar dados (prévia)

O AWS Glue Elastic Views permite usar o SQL familiar para criar exibições materializadas. Use essas visualizações para acessar e combinar dados de vários armazenamentos de dados de origem e mantenha atualizados os dados combinados e com acesso a partir de um armazenamento de dados de destino. A pré-visualização do AWS Glue Elastic Views atualmente é compatível com o Amazon DynamoDB como fonte, com suporte para o Amazon Aurora e o Amazon RDS a seguir. No momento, os destinos compatíveis são o Amazon Redshift, Amazon S3 e Amazon OpenSearch Service (sucessor do Amazon Elasticsearch Service), com suporte para o Amazon Aurora, Amazon RDS e Amazon DynamoDB a seguir. Saiba mais sobre o AWS Glue Elastic Views aqui.

Limpeza e normalização de dados visuais

Novidades

data
  • data
1
Recursos do AWS Glue
Confira os recursos do AWS Glue

Saiba mais sobre os principais recursos do AWS Glue.

Saiba mais 
Cadastre-se para obter uma conta da AWS
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastre-se 
Comece a criar no console
Comece a criar no AWS Glue

Comece a criar com o AWS Glue na interface do visual ETL.

Faça login