Saiba como trabalhar com o Amazon EMR, o Amazon Redshift, o Amazon Kinesis, o Amazon Athena e o restante da plataforma de big data da AWS para processar dados e criar ambientes de big data

O curso Big Data on AWS apresenta soluções de big data baseadas na nuvem, como o Amazon EMR, o Amazon Redshift, o Amazon Kinesis e o restante da plataforma de big data da AWS. Nele iremos demonstrar o uso do Amazon EMR para processar dados utilizando o amplo ecossistema de ferramentas do Hadoop, como o Hive e o Hue. Também ensinaremos a criar ambientes de big data, trabalhar com o Amazon DynamoDB, o Amazon Redshift, o Amazon Quicksight, o Amazon Athena e o Amazon Kinesis, e também a como usufruir das melhores práticas para projetar ambientes de big data seguros e econômicos.

Nível

Intermediário

Modalidade

Curso presencial com instrutor, presencial ou virtual

Duração

3 dias

Esse curso ensina você a:

  • Incluir soluções da AWS dentro de um ecossistema de big data.
  • Utilizar o Apache Hadoop no contexto do Amazon EMR.
  • Identificar os componentes de um cluster do Amazon EMR.
  • Executar e configurar um cluster do Amazon EMR.
  • Utilizar estruturas comuns de programação disponíveis para o Amazon EMR, como Hive, Pig e Streaming.
  • Utilizar o Hue para tornar mais fácil o uso do Amazon EMR.
  • Usar análise de memória com o Spark no Amazon EMR.
  • Escolher as opções adequadas de armazenamento físico de dados da AWS.
  • Identificar os benefícios de usar o Amazon Kinesis para processamento praticamente em tempo real de big data.
  • Utilizar o Amazon Redshift para armazenar e analisar dados com eficiência.
  • Compreender e gerenciar os custos e a segurança de uma solução de big data.
  • Proteger uma solução de big data.
  • Identificar opções de consumo, transferência e compactação de dados.
  • Utilizar o Amazon Athena para análise de consultas ad hoc.
  • Usar software de visualização para descrever dados e consultas utilizando o Amazon QuickSight.
  • Orquestrar fluxos de trabalho de big data usando o AWS Data Pipeline.

Este curso é destinado para:

  • Profissionais responsáveis pelo projeto e pela implementação de soluções de big data, como arquitetos de solução
  • Cientistas e analistas de dados interessados em saber mais sobre os serviços e os padrões de arquitetura por trás das soluções de big data na AWS

Recomendamos que os participantes do curso tenham os seguintes pré-requisitos:

  • Familiaridade básica com tecnologias de big data, como Apache Hadoop, MapReduce, HDFS e consultas SQL/NoSQL
  • Os alunos devem concluir o treinamento online gratuito Big Data Technology Fundamentals, ou apresentar uma experiência equivalente
  • Conhecimento prático dos principais Serviços da AWS e de implementação na nuvem pública
  • Os alunos devem concluir o curso AWS Technical Essentials, ou apresentar uma experiência equivalente
  • Entendimento básico de armazéns de dados, sistemas de banco de dados relacional e projeto de banco de dados

Este curso será entregue combinando:

  • Treinamento presencial com instrutor (ILT)
  • Laboratórios práticos

Este curso permite que você teste novas habilidades e aplique o seu conhecimento ao ambiente de trabalho por meio de uma série de exercícios práticos.

Observação: a descrição dos cursos pode variar um pouco de acordo com a localização regional e/ou o idioma de onde as aulas estão sendo ministradas.

Dia 1

  • Visão geral de big data
  • Ingestão e transferência de big data
  • Streaming de big data e o Amazon Kinesis
  • Laboratório 1: Como usar o Amazon Kinesis para fazer o streaming e analisar dados de log do Apache Server
  • Soluções de armazenamento de big data
  • Processamento e análise de big data
  • Laboratório 2: Como usar o Amazon Athena para consultar dados de log do Amazon S3

Dia 2

  • Apache Hadoop e Amazon EMR
  • Laboratório 3: Como armazenar e consultar dados no Amazon DynamoDB
  • Como usar o Amazon EMR
  • Estruturas de programação do Hadoop
  • Laboratório 4: Como processar logs de servidor usando o Hive no Amazon EMR
  • Interfaces web no Amazon EMR
  • Laboratório 5: Como executar scripts do Pig dentro do Hue no Amazon EMR
  • Apache Spark no Amazon EMR
  • Laboratório 6: Como processar dados da New York City Yellow Taxi Cab usando o Spark no Amazon EMR

Dia 3

  • Amazon Redshift e big data
  • Como visualizar e orquestrar big data
  • Laboratório 7: Como usar o TIBCO Spotfire para visualizar dados
  • Como gerenciar custos de big data
  • Como proteger suas implantações da Amazon
  • Padrões de projeto de big data
Big Data Thumbnail

Acesse aws.training