Saiba como trabalhar com o Amazon EMR, o Amazon Redshift, o Amazon Kinesis, o Amazon Athena e o restante da plataforma de big data da AWS para processar dados e criar ambientes de big data

O curso Big Data on AWS (Big data na AWS) apresenta soluções de big data baseadas na nuvem, como o Amazon EMR, o Amazon Redshift, o Amazon Kinesis e o restante da plataforma de big data da AWS. Nele, demonstraremos o uso do Amazon EMR para processar dados utilizando o amplo ecossistema de ferramentas do Hadoop, como o Hive e o Hue. Também ensinaremos a criar ambientes de big data, trabalhar com o Amazon DynamoDB, o Amazon Redshift, o Amazon Quicksight, o Amazon Athena e o Amazon Kinesis, e também a como usufruir das melhores práticas para projetar ambientes de big data seguros e econômicos.

Nível

Intermediário

Modalidade

Sala de aula, curso presencial ou virtual

Duração

3 dias

Esse curso ensina você a:

  • Incluir soluções da AWS dentro de um ecossistema de big data.
  • Utilizar o Apache Hadoop no contexto do Amazon EMR.
  • Identificar os componentes de um cluster do Amazon EMR.
  • Executar e configurar um cluster do Amazon EMR.
  • Utilizar estruturas comuns de programação disponíveis para o Amazon EMR, como Hive, Pig e Streaming.
  • Utilizar o Hue para tornar mais fácil o uso do Amazon EMR.
  • Usar análise de memória com o Spark no Amazon EMR.
  • Escolher as opções adequadas de armazenamento físico de dados da AWS.
  • Identificar os benefícios de usar o Amazon Kinesis para processamento praticamente em tempo real de big data.
  • Utilizar o Amazon Redshift para armazenar e analisar dados com eficiência.
  • Compreender e gerenciar os custos e a segurança de uma solução de big data.
  • Identificar opções de consumo, transferência e compactação de dados.
  • Utilizar o Amazon Athena para análise de consultas ad hoc.
  • Utilizar o AWS Glue para automatizar cargas de trabalho ETL.
  • Usar software de visualização para descrever dados e consultas utilizando o Amazon QuickSight.
  • Orquestrar fluxos de trabalho de big data usando o AWS Data Pipeline.

Este curso é destinado para:

  • Indivíduos responsáveis pelo projeto e implementação de soluções de big data, como arquitetos de solução e administradores de operações de sistemas
  • Cientistas e analistas de dados interessados em saber mais sobre os serviços e os padrões de arquitetura por trás das soluções de big data na AWS

Recomendamos que os participantes do curso tenham os seguintes pré-requisitos:

  • Familiaridade básica com tecnologias de big data, como Apache Hadoop, HDFS e consultas SQL/NoSQL
  • Os alunos devem concluir o treinamento digital gratuito Big Data Technology Fundamentals (Fundamentos da tecnologia de big data) ou apresentar uma experiência equivalente
  • Conhecimento prático dos principais Serviços da AWS e de implementação na nuvem pública
  • Os alunos devem concluir o curso AWS Technical Essentials, ou apresentar uma experiência equivalente
  • Entendimento básico de armazéns de dados, sistemas de banco de dados relacional e projeto de banco de dados

Este curso será entregue combinando:

  • Treinamento presencial com instrutor (ILT)
  • Laboratórios práticos

Este curso permite que você teste novas habilidades e aplique o seu conhecimento ao ambiente de trabalho por meio de uma série de exercícios práticos.

Observação: a descrição dos cursos pode variar um pouco de acordo com a localização regional e/ou o idioma de onde as aulas estão sendo ministradas.

1º dia

  • Visão geral de big data
  • Consumo
  • Streaming de big data e o Amazon Kinesis
  • Utilização do Amazon Kinesis para fazer streaming e analisar logs do Apache Server
  • Soluções de armazenamento
  • Utilização do Amazon Athena para analisar dados de log
  • Introdução ao Apache Hadoop e ao Amazon EMR

2º dia

  • Utilização do Amazon Elastic MapReduce
  • Armazenamento e consultas de dados no DynamoDB
  • Estruturas de programação do Hadoop
  • Processamento de logs de servidor usando o Hive no Amazon EMR
  • Como facilitar a sua experiência com o Amazon EMR usando o HUE
  • Execução de scripts do Pig dentro do Hue no Amazon EMR
  • Spark no Amazon EMR
  • Processamento do conjunto de dados da New York Taxi usando o Spark na Amazon EMR

3º dia

  • Utilização do AWS Glue para automatizar cargas de trabalho ETL
  • Amazon Redshift e big data
  • Como visualizar e orquestrar big data
  • Gerenciamento de custos no Amazon EMR
  • Segurança de soluções de big data
  • Padrões de projeto de big data
Big Data Thumbnail

Acesse aws.training