Big Data en AWS

Aprenda a trabajar con Amazon EMR, Amazon Redshift, Amazon Kinesis, Amazon Athena y las demás plataformas de big data de AWS para procesar datos y crear entornos de big data.

En este curso, conocerá las soluciones de big data basadas en la nube, como Amazon EMR, Amazon Redshift, Amazon Kinesis y el resto de la plataforma de big data de AWS. Le mostraremos cómo utilizar Amazon EMR para procesar datos con el amplio ecosistema de herramientas de Hadoop, como Hive y Hue. También le enseñaremos a crear entornos de big data, a trabajar con Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena y Amazon Kinesis, así como a utilizar las prácticas recomendadas para diseñar entornos de big data para lograr seguridad y rentabilidad.

Objetivos del curso

En este curso, aprenderá a:

  • Implementar soluciones de AWS en un ecosistema de big data
  • Utilizar Apache Hadoop en el contexto de Amazon EMR
  • Identificar los componentes de un clúster de Amazon EMR, luego lanzarlo y configurar un clúster de Amazon EMR
  • Usar marcos de programación habituales disponibles para Amazon EMR, entre otros, Hive, Pig y streaming
  • Optimizar la facilidad de uso de Amazon EMR mediante el uso de Hadoop User Experience (Hue)
  • Utilizar análisis integrados en memoria con Apache Spark en Amazon EMR
  • Elegir opciones apropiadas de almacenamiento de datos en AWS
  • Identificar los beneficios de utilizar Amazon Kinesis para un procesamiento de big data casi en tiempo real
  • Aprovechar Amazon Redshift para almacenar y analizar datos de forma eficaz
  • Entender y administrar los costos y la seguridad para una solución de big data
  • Identificar opciones para administrar, transferir y comprimir datos
  • Aprovechar Amazon Athena para análisis de consultas ad hoc
  • Usar AWS Glue para automatizar las cargas de trabajo de extracción, transformación y carga (ETL)
  • Utilizar software de visualización para describir datos y consultas con Amazon QuickSight

Destinatarios previstos

Este curso está dirigido a:

  • Arquitectos de soluciones
  • Administradores de operaciones de sistemas
  • Científicos de datos
  • Analistas de datos
icon_big-data

Información general del curso

mini-icon_training
mini-icon_level
mini-icon_time
mini-icon_language

Modalidad del curso
Presencial | Laboratorios prácticos

Nivel del curso
Intermedio

Duración del curso
3 días

Idioma del curso
Disponible en varios idiomas