Amazon EMR

Execute e escale facilmente o Apache Spark, o Hive, o Presto e outras workloads de big data

Execute aplicações de big data e análises de dados em escala de petabyte com mais rapidez e com menos da metade do custo das soluções on-premises.

Construa aplicações usando as mais recentes frameworks de código aberto, com opções para execução em clusters personalizados do Amazon EC2, Amazon EKS, AWS Outposts ou Amazon EMR Serverless.

Tenha insights até na metade do tempo com versões do Spark, Hive e Presto de código aberto otimizadas para performance e compatíveis com APIs.

Desenvolva, visualize e depure facilmente suas aplicações usando os cadernos do EMR e ferramentas conhecidas de código aberto no EMR Studio.

Como funciona

Amazon EMR é a solução de big data em nuvem líder do setor para processamento de dados, análise interativa e machine learning que usa estruturas de código aberto, como Apache Spark, Apache Hive e Presto.

Introducing EMR Serverless (Introdução ao EMR Serverless) (2:02)
Introdução ao Amazon EMR Serverless
O Amazon EMR Serverless é uma nova opção do Amazon EMR que facilita e reduz custos para os engenheiros e analistas de dados na execução de aplicações criadas com frameworks de big data de código aberto, como Apache Spark, Hive ou Presto, sem a necessidade de ajustar, operar, otimizar, proteger ou gerenciar clusters.
Introdução ao Amazon EMR Serverless
O Amazon EMR Serverless é uma nova opção do Amazon EMR que facilita e reduz custos para os engenheiros e analistas de dados na execução de aplicações criadas com frameworks de big data de código aberto, como Apache Spark, Hive ou Presto, sem a necessidade de ajustar, operar, otimizar, proteger ou gerenciar clusters. O EMR Serverless aumenta ou reduz a escala na vertical dos recursos de computação e memória, conforme a necessidade da aplicação, e você só paga pelos recursos usados pela aplicação.

Casos de uso

Realize análises de big data

Execute processamento de dados distribuídos e análises de hipóteses em grande escala usando algoritmos estatísticos e modelos preditivos para revelar padrões ocultos, correlações, tendências de mercado e preferências dos clientes.

Crie pipelines de dados escaláveis

Extraia dados de diversas fontes, processe-os em escala e disponibilize-os para aplicações e usuários.

Processe fluxos de dados em tempo real

Analise eventos de origens de dados de transmissão em tempo real para criar pipelines de dados de transmissão de longa duração, alta disponibilidade e tolerantes a falhas.

Acelere a ciência de dados com a adoção de ML

Analise dados usando frameworks de ML de código aberto, como Apache Spark MLlib, TensorFlow e Apache MXNet. Conecte-se ao Amazon SageMaker Studio para realizar treinamento de modelos, análises e relatórios em grande escala.

Como começar a usar

Descubra como o Amazon EMR funciona

Saiba mais sobre provisionamento de clusters, escalabilidade de recursos, configuração de alta disponibilidade e muito mais.

Explore recursos do Amazon EMR »

Explore os preços do Amazon EMR

Pague por segundo com opções de executar clusters do EMR no Amazon EC2, Amazon EKS, AWS Outposts ou no Amazon EMR Serverless.

Saiba mais sobre os preços do Amazon EMR »

Comece a usar o Amazon EMR

Saiba mais sobre processamento de fluxos em tempo real, machine learning em grande escala e muito mais usando o EMR.

Confira os tutoriais do Amazon EMR »

Veja mais sobre a AWS