Comenzar con el proyecto

5 pasos  |  60 minutos

Analyze_Big_Data_HERO-ART_SM

Amazon EMR es un servicio administrado que permite ejecutar Apache Hadoop y Spark de manera rápida, fácil y rentable para procesar grandes volúmenes de datos. Amazon EMR también es compatible con herramientas de Hadoop eficaces y confiables, como Presto, Hive, Pig, HBase, entre otras. En este proyecto, implementará un clúster de Hadoop completamente funcional, listo para analizar datos de log en tan solo unos minutos. Primero, lanzará un clúster de Amazon EMR y, a continuación, usará un script de HiveQL para procesar datos de log de muestra almacenados en un bucket de Amazon S3. HiveQL es un lenguaje de script similar a SQL utilizado para el análisis y almacenamiento de datos. Luego, puede usar una configuración similar para analizar sus propios archivos de log.

aws-project_analyze-big-data_diagram
Comenzar con el proyecto

Logrará:

Lanzar un clúster de Hadoop completamente funcional con Amazon EMR.

Definir el esquema y crear una tabla para los datos de log de muestra almacenados en Amazon S3.

Analizar los datos con un script de HiveQL y grabar los resultados en Amazon S3.

Descargar y ver los resultados en su equipo.

Lo que necesitará antes de comenzar:

Una cuenta de AWS: necesitará una cuenta de AWS para comenzar a aprovisionar recursos para hospedar su sitio web. Inscríbase en AWS.

Experiencia en TI: se recomienda contar con experiencia previa en Hadoop, aunque no es obligatorio, para completar este proyecto.

Experiencia en AWS: se sugiere contar con conocimiento básico del par de claves de Amazon S3 y Amazon EC2, aunque no es obligatorio, para completar este proyecto.

Cálculos de facturación:

Costo para completar el proyecto: el costo estimado para completar este proyecto es 1,05 USD. El costo asume que usted se encuentra dentro de los límites de la capa gratuita de AWS, respeta las configuraciones recomendadas y que terminará todos los recursos utilizados en el proyecto antes de que transcurra una hora a partir de su creación. Es posible que su caso de uso requiera configuraciones diferentes que podrían afectar la facturación. Utilice la Calculadora coste mensual para calcular los costos personalizados acordes a sus necesidades.

Cálculo de facturación mensual: el costo total de este proyecto variará según el uso y las configuraciones. Si utiliza la configuración predeterminada que se recomienda en esta guía, el costo normal será 769 USD al mes para este proyecto. Los precios de AWS se basan en el uso que realiza de cada servicio individual. El uso total combinado de cada servicio dará lugar a su factura mensual. Explore las pestañas de debajo para aprender para qué sirve cada servicio y cómo afecta a su factura. Para ver un desglose de los servicios en uso y sus costos asociados, consulte Servicios utilizados y costos.


Obtenga más información acerca de las soluciones de big data en AWS y regístrese en un seminario web.

Obtenga más información acerca de las características, los beneficios y los casos de uso claves de Amazon EMR.

¿Necesita más recursos para comenzar con AWS? Visite la página de Introducción del centro de recursos para obtener más información.