Saiba como projetar, criar e operar uma solução de data lake sem servidor com os Serviços da AWS

Building a Serverless Data Lake é um bootcamp de nível avançado, com duração de um dia, que ensina a projetar, criar e operar uma solução de data lake sem servidor usando os Serviços da AWS. O bootcamp incluirá tópicos, como a ingestão de dados de qualquer fonte de dados em grande escala, o armazenamento de dados de modo seguro e duradouro, a habilitação do uso da ferramenta certa para processar grandes volumes de dados, além da compreensão das opções disponíveis para a análise de dados em praticamente tempo real.

Nível

Avançado

Modalidade

Curso presencial com instrutor

Duração

1 dia

Esse curso ensina você a:

  • Coletar grandes quantidades de dados usando serviços como o Kinesis Streams e o Firehose e também armazenar os dados de modo duradouro e seguro no Amazon Simple Storage Service (S3).
  • Criar um índice de metadados do seu data lake.
  • Escolher as melhores ferramentas para ingerir, armazenar, processar e analisar seus dados no lake.
  • Aplicar seus conhecimentos em laboratórios práticos que ofereçam experiências reais por meio da criação de uma solução completa.
     

Este curso é destinado para:

  • Arquitetos de soluções
  • Desenvolvedores de big data
  • Arquitetos e analistas de dados
  • Outros profissionais de análise prática de dados

Recomendamos que os participantes do curso tenham os seguintes pré-requisitos:

  • Bom conhecimento profissional dos principais Serviços da AWS, como o Amazon Elastic Compute Cloud (EC2) e o Amazon Simple Storage Service (S3)
  • Alguma experiência profissional com linguagem de programação ou scripting
  • Familiaridade com o sistema operacional Linux e a interface da linha de comando
  • Exige um laptop para concluir exercícios de laboratório (tablets não são indicados)

Este curso será entregue combinando:

  • Treinamento presencial com instrutor (ILT)
  • Laboratórios práticos

Este curso aborda os seguintes conceitos:

  • Principais serviços que ajudam a habilitar a arquitetura de data lake sem servidor
  • Solução de análise de dados que segue o fluxo de ingestão, armazenamento, processamento e análise
  • Implantação de um modelo repetido para a implementação de uma solução de data lake
  • Criação de um índice de metadados e habilitação do recurso de pesquisa
  • Configuração de um pipeline de consumo de dados em grande escala por meio de várias fontes de dados
  • Transformação de dados com funções simples acionadas por evento
  • Processamento de dados ao escolher os melhores serviços e ferramentas para o caso de uso
  • Opções disponíveis para analisar melhor os dados processados
  • Melhores práticas para implantações e operações
Acesse aws.training