Amazon EMR

Ejecución y escalado sencillos de Apache Spark, Hive, Presto y otras cargas de trabajo de big data

Ejecute aplicaciones de big data y análisis de datos a escala de petabytes con mayor rapidez y a menos de la mitad del costo de las soluciones en las instalaciones.

Cree aplicaciones con los últimos marcos de código abierto, con opciones de ejecución en clústeres personalizados de Amazon EC2, Amazon EKS, AWS Outposts o Amazon EMR Serverless.

Logre que el tiempo para obtener información sea hasta 2 veces más rápido con versiones de Spark, Hive y Presto compatibles con API de código abierto y de rendimiento optimizado.

Desarrolle, visualice y depure fácilmente sus aplicaciones con EMR Notebooks y las herramientas de código abierto conocidas de EMR Studio.

Funcionamiento

Amazon EMR es la solución de macrodatos en la nube líder del sector destinada al procesamiento de datos a escala de petabytes, análisis interactivo y aprendizaje automático mediante el uso de marcos de código abierto, como Apache Spark, Apache Hive y Presto.

Introducing EMR Serverless (Presentamos EMR sin servidor) (2:02)
Presentamos Amazon EMR sin servidor
Amazon EMR sin servidor es una nueva opción de Amazon EMR que hace que sea fácil y rentable para los ingenieros y analistas de datos ejecutar aplicaciones creadas con marcos de macrodatos de código abierto, como Apache Spark, Hive o Presto, sin tener que ajustar, operar, optimizar, proteger o administrar clústeres.
Presentamos Amazon EMR sin servidor
Amazon EMR sin servidor es una nueva opción de Amazon EMR que hace que sea fácil y rentable para los ingenieros y analistas de datos ejecutar aplicaciones creadas con marcos de macrodatos de código abierto, como Apache Spark, Hive o Presto, sin tener que ajustar, operar, optimizar, proteger o administrar clústeres. EMR sin servidor escala o reduce verticalmente los recursos de computación y memoria según demande la aplicación, y solo pagará por los recursos que utilice su aplicación.

Casos de uso

Ejecución de análisis de big data

Ejecute procesamientos de datos a gran escala y análisis hipotéticos utilizando algoritmos estadísticos y modelos predictivos para descubrir patrones ocultos, correlaciones, tendencias del mercado y preferencias de los clientes.

Creación de canalizaciones de datos escalables

Extraiga datos de una variedad de orígenes, procéselos a escala y póngalos a disposición de las aplicaciones y los usuarios.

Procesamiento de flujos de datos en tiempo real

Analice los eventos de orígenes de datos de streaming en tiempo real para crear canalizaciones de datos de streaming de larga duración, altamente disponibles y tolerantes a errores.

Acelere la adopción de machine learning y ciencia de datos

Analice los datos con marcos de ML de código abierto como Apache Spark MLlib, TensorFlow y Apache MXNet. Conéctese a Amazon SageMaker Studio para la formación de modelos a gran escala, el análisis y la creación de informes.

Cómo comenzar

Descubra cómo funciona Amazon EMR

Obtenga más información sobre el aprovisionamiento de clústeres, el escalado de recursos, la configuración de la alta disponibilidad y mucho más.

Ver las características de Amazon EMR »

Vea los precios de Amazon EMR

Pague por segundo con opciones para ejecutar clústeres de EMR en Amazon EC2, Amazon EKS, AWS Outposts o Amazon EMR Serverless.

Obtenga más información sobre los precios de Amazon EMR »

Introducción a Amazon EMR

Conozca el procesamiento de flujos en tiempo real, el machine learning a gran escala y mucho más mediante EMR.

Consulte los tutoriales de Amazon EMR »

Ver más sobre AWS