Aprenda cómo trabajar con Amazon EMR, Amazon Redshift, Amazon Kinesis, Amazon Athena y las demás plataformas de big data de AWS para procesar datos y crear entornos de big data

Big data en AWS le presenta las soluciones de big data basadas en la nube, como Amazon EMR, Amazon Redshift, Amazon Kinesis y el resto de la plataforma de big data de AWS. En este curso le mostramos cómo utilizar Amazon EMR para procesar datos con el amplio ecosistema de herramientas de Hadoop como Hive y Hue. También le enseñamos a crear entornos de big data, a trabajar con Amazon DynamoDB, Amazon Redshift, Amazon Quicksight, Amazon Athena y Amazon Kinesis, así como a utilizar las prácticas recomendadas para diseñar entornos de big data con fines de seguridad y rentabilidad.

Nivel

Intermedio

Metodología

Impartido por instructor, clase virtual o en vivo

Longitud

3 días

Este curso le enseñará a:

  • Encajar soluciones AWS en un ecosistema de big data.
  • Utilizar Apache Hadoop en el contexto de Amazon EMR.
  • Identificar los componentes de un clúster de Amazon EMR.
  • Lanzar y configurar un clúster de Amazon EMR.
  • Aprovechar marcos de programación habituales disponibles para Amazon EMR, entre otros, Hive, Pig y Streaming.
  • Aprovechar Hue para facilitar más el uso de Amazon EMR.
  • Utilizar análisis integrados en memoria con Spark en Amazon EMR.
  • Elegir opciones apropiadas de almacenamiento de datos para AWS.
  • Identificar los beneficios de utilizar Amazon Kinesis para un procesamiento de big data casi en tiempo real.
  • Aprovechar Amazon Redshift para almacenar y analizar datos de forma eficaz.
  • Entender y administrar los costos y la seguridad para una solución de big data.
  • Asegurar una solución de big data.
  • Identificar opciones para administrar, transferir y comprimir datos.
  • Aprovechar Amazon Athena para análisis de consultas ad hoc.
  • Utilizar software de visualización para describir datos y consultas con Amazon Quicksight.
  • Orquestar flujos de datos de big data mediante AWS Data Pipeline.

Este curso está dirigido a:

  • Individuos responsables del diseño e implementación de soluciones para big data, es decir, arquitectos de soluciones
  • Científicos y analistas de datos interesados en aprender sobre los servicios y patrones de arquitectura tras las soluciones de big data en AWS

Aconsejamos que los asistentes a este curso cumplan con los siguientes requisitos previos:

Este curso se impartirá mediante una combinación de:

  • Capacitación guiada por un instructor
  • Laboratorios prácticos

Este curso le permite probar nuevas habilidades y aplicar los conocimientos en su entorno laboral a través de una amplia variedad de ejercicios prácticos.

Nota: el esquema del curso puede variar ligeramente de una ubicación regional a otra y dependiendo del idioma en el que se imparta el curso.

Día 1

  • Información general sobre big data
  • Recepción y transferencia de big data
  • Streaming de big data y Amazon Kinesis
  • Lab 1: Uso de Amazon Kinesis para distribuir por streaming y analizar datos de log del servidor Apache
  • Soluciones de almacenamiento de big data
  • Procesamiento y análisis de big data
  • Lab 2: Uso de Amazon Athena para realizar consultas de datos de log de Amazon S3

Día 2

  • Apache Hadoop y Amazon EMR
  • Lab 3: Almacenamiento y consulta de datos en Amazon DynamoDB
  • Uso de Amazon EMR
  • Marcos de programación Hadoop
  • Lab 4: Logs del servidor de procesamiento con Hive en Amazon EMR
  • Interfaces web en Amazon EMR
  • Lab 5: Ejecución de scripts de Pig con Hue en Amazon EMR
  • Apache Spark en Amazon EMR
  • Lab 6: Procesamiento de datos de NY Taxi con Spark en Amazon EMR

Día 3

  • Amazon Redshift y big data
  • Visualización y orquestación de big data
  • Lab 7: Uso de TIBCO Spotfire para visualizar datos
  • Administración de costos de big data
  • Protección de las implementaciones de Amazon
  • Patrones de diseño de big data
Big Data Thumbnail

Visite aws.training