Publicado: Nov 28, 2023
Agora você pode acelerar o processamento e a análise de dados com as aplicações do Apache Spark em até quatro vezes em relação aos dados no S3 Standard usando o Amazon EMR e a classe de armazenamento do Amazon S3 Express One Zone. O S3 Express One Zone é uma classe de armazenamento de alta performance com zona de disponibilidade única, criada especificamente para oferecer acesso consistente a dados de até dez milissegundos para seus dados acessados com mais frequência e aplicações sensíveis à latência.
O Amazon EMR é a solução de big data em nuvem líder do setor para processamento de dados, análise interativa e machine learning em estruturas de código aberto otimizadas para escala de petabytes na AWS. Se você tem workloads de performance crítica com acordos de serviço (SLAs), como para requisitos de tempo de conclusão de tarefas para atualizações de data lake, ou precisa de um tempo de resposta rápido para relatórios de painel de BI, use o S3 Express One Zone ao executar aplicações do EMR Spark no cluster do EC2.
O S3 Express One Zone está disponível com a versão 6.15.0 do Amazon EMR nas regiões da AWS que oferecem o S3 Express One Zone. Para começar, mova seus dados para o armazenamento do S3 Express One Zone e use o conector S3a em seu código do Spark para ler e gravar dados. O S3a é o conector usado pelo EMR para processar objetos do S3 e é necessário com os buckets do S3 Express One Zone. Para saber mais, consulte Using EMR with data in S3 Express One Zone na documentação do Amazon EMR.