Establezca las bases para trabajar con los servicios de AWS para soluciones de big data

Aspectos fundamentales de tecnología de big data proporciona un conocimiento general básico de las tecnologías utilizadas en soluciones de big data. Abarca el desarrollo de soluciones de big data utilizando el ecosistema de Hadoop, incluidos MapReduce, HDFS y los marcos de programación Pig y Hive. Este curso basado en la web ayuda a desarrollar una base para trabajar con servicios de AWS para soluciones de big data. Este curso se ofrece de forma gratuita y se puede utilizar de forma independiente o como ayuda para prepararse para el curso con instructor Big Data on AWS.

Nivel

Básico

Metodología

Digital, autoguiado

Duración

90 minutos

Este curso está diseñado para enseñarle a:

  • Identificar herramientas y tecnologías comunes que se pueden utilizar para crear soluciones de big data.
  • Comprender el marco de programación MapReduce, incluyendo la asignación, la reorganización y ordenación, y la reducción de componentes.
  • Diferenciar las opciones disponibles para crear una solución de big data utilizando el marco de programación Hive.

Este curso está dirigido a:

  • Usuarios no familiarizados con los conceptos de big data, incluidos arquitectos de soluciones empresariales, arquitectos de soluciones de big data, científicos de datos y analistas de datos

Aconsejamos que los asistentes a este curso:

  • Tengan conocimientos prácticos sobre programación básica en un lenguaje como Java o C#

Este curso se impartirá mediante:

  • Formación electrónica basada en la web

Nota: el esquema del curso puede variar ligeramente de una ubicación regional a otra y dependiendo del idioma en el que se imparta el curso.

Módulo 1 – Introducción a big data

  • La importancia empresarial de los big data
  • El ecosistema de Hadoop
  • Características de los big data
  • Procesamiento de big data
  • Herramientas y técnicas para analizar big data
  • Implementación de soluciones de big data
  • Caso práctico – Análisis de redes sociales

Módulo 2 – Introducción a MapReduce y Hadoop

  • Arquitectura de Hadoop
  • Marco de trabajo de MapReduce
  • Programación de MapReduce
  • MapReduce y HDFS/S3
  • Caso de uso – Motor de recomendaciones

Módulo 3 – Análisis de datos con programación de Pig

  • Introducción a Pig
  • Tipos de datos de Pig
  • Representación de datos en Pig
  • Ejecución de Pig
  • Funciones definidas por el usuario
  • Pig frente a RDBMS tradicionales
  • Advanced Techniques in Pig  

Módulo 4 – Consulta de big data con Hive

  • Introducción a Hive
  • Representación de datos en Hive
  • Tipos de datos de Hive
  • Sondeo de datos con consultas de Hive
  • Hive y AWS
  • Caso de uso – Análisis ad hoc y comentarios sobre productos
Regístrese ahora en aws.training