Comece a usar o projeto

5 etapas  |  60 minutos

Analyze_Big_Data_HERO-ART_SM

P: O que é o Amazon EMR?

O Amazon EMR é um serviço gerenciado de Hadoop que permite executar as mais recentes versões de frameworks de big data populares, como Apache Spark, Presto, Hbase e Hive, entre outros, em clusters totalmente personalizáveis. O Amazon EMR oferece controle completo sobre a configuração dos clusters e do software instalado neles.

P: O que posso fazer com o Amazon EMR?

Use o Amazon EMR para provisionar instantaneamente frameworks populares de código aberto, como Hadoop e Spark, com a capacidade necessária para executar tarefas com uso intensivo de dados. Os casos de uso comuns incluem indexação da web, mineração de dados, análise de arquivos de log, extração-transformação-carga (ETL), aprendizado de máquina, análise financeira, simulação científica e pesquisa de bioinformática. O Amazon EMR permite que você se concentre na decodificação ou análise dos dados sem ter de se preocupar com a configuração, a gestão ou o ajuste de clusters Hadoop, o que consome tempo, ou com a capacidade de computação na qual estão baseados.

O Amazon EMR é ideal para problemas que necessitam de processamento rápido e eficiente de grandes quantidades de dados. As interfaces de serviço da Web permitem que você crie fluxos de trabalho de processamento e monitore, de forma programada, o andamento dos clusters em execução. Além disso, você pode usar a interface web simples do Console de Gerenciamento da AWS para lançar clusters e monitorar cálculos com uso intensivo de processamento.

P: Posso usar esse projeto para analisar meus próprios logs?

Sim. Você pode carregar seus próprios logs de dados para um bucket do Amazon S3 e usar um cluster similar para executar consultas com seus próprios dados. No entanto, esse projeto não foi concebido para ambientes de produção.

P: Como faço para colocar dados no Amazon S3?
Você pode criar buckets, fazer upload de objetos e definir controles de acesso com facilidade e segurança usando o Console de Gerenciamento da AWS. O Guia de conceitos básicos do Amazon S3 mostra como começar a usar o Console de Gerenciamento da AWS com o Amazon S3.

Além disso, o Amazon S3 é integrado a vários outros serviços da AWS e a conectores de terceiros para ajudar a transferir dados para dentro e para fora da nuvem. Saiba mais sobre as ferramentas de migração de dados para a nuvem.

P: Meus dados estão seguros?

O Amazon S3 é seguro por padrão. Só os proprietários de balde e de objeto originalmente têm acesso aos recursos do Amazon S3 que criam. O Amazon S3 oferece suporte à autenticação de usuário para controlar o acesso aos dados. Você pode fazer o upload/download de dados para o Amazon S3 com segurança por meio de endpoints SSL usando o protocolo HTTPS. É possível usar ferramentas do AWS Identity and Access Management (IAM), como os usuários e as funções do IAM, para controlar acesso e permissões. Por exemplo, você pode conceder a determinados usuários acesso de leitura, mas não de gravação, aos seus clusters. Além disso, é possível usar as configurações de segurança do Amazon EMR para definir várias opções de criptografia para dados ociosos e em trânsito, incluindo a compatibilidade com a criptografia do Amazon S3. Saiba mais sobre como controlar o acesso ao seu cluster e a criptografia do Amazon EMR.

Comece a usar o projeto