O Amazon EMR facilita o fornecimento e gerenciamento do Hadoop na nuvem da AWS. O Hadoop está disponível em diversas distribuições. A Amazon EMR oferece a você a opção de usar a distribuição da Amazon ou a distribuição de MapR para Hadoop.

O MapR oferece o Hadoop com uma plataforma corporativa comprovada que oferece suporte a um amplo conjunto de usos de produção em tempo real e críticos para a missão. O MapR traz uma confiabilidade sem precedentes, facilidade de uso e velocidade recorde a aplicativos de Hadoop, NoSQL, banco de dados e streaming em uma única plataforma de big data unificada. O MapR é usado em serviços financeiros, varejo, mídia, saúde, manufatura, telecomunicações e organizações governamentais, bem como pelas principais empresas do Fortune 100 e Web 2.0. Dentre os investidores estão Lightspeed Venture Partners, Mayfield Fund, NEA e Redpoint Ventures. Conecte-se com MapR no Facebook, LinkedIn e Twitter.

Comece a usar o Amazon EMR

Crie uma conta gratuita

Caso você precise processar grandes quantidades de dados, pode se qualificar para uma definição de preço mais baixa.

Entre em contato conosco para saber mais.

mapr-280
  • Recuperação instantânea: o MapR M7 oferece uma alta disponibilidade do banco de dados. O sistema se recupera automaticamente de qualquer falha de nó em segundos, permitindo que o aplicativo continue a operar sem qualquer impacto.
  • Administração HBase zero: o MapR M7 permite que os usuários usem tabelas sem executar serviços separados, como RegionServers. Além disso, o M7 elimina compactações e fornece divisões de região simplificadas, de forma que o administrador não precise executar essas operações manualmente.
  • Baixa latência contínua: o MapR M7 oferece uma baixa latência contínua evitando coletas de lixo ou compactações que afetam o desempenho. A baixa E/S de disco, juntamente com um menor espaço de disco, fazem com que as operações do banco de dados no disco sejam rápidas e previsíveis.
  • Proteção total de dados com snapshots: o M7 oferece proteção total de dados para o HBase. Os snapshots permitem a recuperação pontual de tabelas para proteger contra erros de usuários ou do aplicativo. O M7 expande os snapshots para incluir todos os dados, tanto de arquivos quanto de tabelas. As tabelas do HBase podem ser lidas diretamente de snapshots e recuperadas diretamente sem o tempo de inatividade necessário para restaurar o HBase em outras distribuições.
  • Continuidade de negócios com espelhamento: o espelhamento permite que os usuários repliquem automaticamente dados diferenciais em tempo real entre clusters. Isso pode ser usado para criar soluções de recuperação de desastre para banco de dados ou aproveitado para fornecer acesso somente leitura de dados de vários locais. Como o M7 não precisa que os RegionServers sejam reconstruídos, os bancos de dados podem ser ativados instantaneamente ao site espelhado se o site ativo cair.
  • NFS: o MapR fornece acesso aleatório de leitura/gravação e uma interface NFS padrão para que os usuários possam montar o cluster e aproveitar aplicativos baseados em arquivos padrão com Hadoop, incluindo utilitários Linux, navegadores e aplicativos não Java. Ao usar o MapR no Amazon EMR, a interface NFS é pré-montada em /mapr.
  • ODBC: o MapR oferece um driver ODBC para o Hive que está em conformidade com a especificação padrão ODBC 3.52, permitindo que os usuários usem qualquer ferramenta de BI ou criador de consulta SQL com Hadoop. MicroStrategy, Tableau, Excel, Toad e muitas outras ferramentas comerciais e de código aberto são suportadas.
  • Implementação: o Amazon EMR com MapR automatiza completamente o fornecimento, instalação e configuração do cluster, que poderá ser iniciado pelo AWS Management Console, CLI ou API.
  • MapR Control System (MCS – Sistema de controle MapR): o MapR fornece monitoramento e gerenciamento de ponta a ponta para Hadoop, inclusive de hardware, armazenamento, MapReduce e outros componentes na distribuição.
  • CLI e REST API: todos os recursos MCS também são expostos pelo CLI e REST API. Isso permite que os usuários obtenham informações do cluster e realizem operações de forma programática. E também permite a integração com sistemas de gerenciamento/monitoramento personalizados e de terceiros.
  • Alta disponibilidade do sistema de arquivos: o MapR fornece uma arquitetura sem NameNode que pode tolerar várias falhas simultâneas com failover e fallback automáticos. Os metadados são distribuídos e replicados assim como os dados. Sem NameNode, não há limite prático de quantos arquivos podem ser armazenados e também não há dependência de qualquer NAS externo.
  • Alta disponibilidade do MapReduce: o MapR fornece o JobTracker HA, com failover e fallback automáticos. Se o JobTracker ativo falhar, ele será automaticamente iniciado em um nó diferente e todas as tarefas continuarão a ser executadas sem interrupção.
  • Proteção de dados: o MapR fornece snapshots para recuperação pontual, permitindo que os usuários se recuperem de erros de usuários e do aplicativo. O MapR usa tecnologia de redirecionamento na gravação, assim, o snapshot é feito somente em blocos alterados, evitando qualquer impacto no desempenho. Observe que os snapshots são comprovadamente consistentes. Portanto, todos os aplicativos são suportados.
  • Recuperação de desastres: o MapR fornece espelhamento entre clusters, permitindo a recuperação de desastres entre zonas de disponibilidade, bem como implementações híbridas envolvendo clusters EMR e no local. Para implementações híbridas, todas as distribuições de Hadoop baseadas em MapR são suportadas, incluindo EMC Greenplum MR e o Cisco UCS. Observe que somente blocos alterados são transferidos e que todos os dados são automaticamente compactados.
  • Compactação: o MapR compacta de forma automática e transparente todos os dados que ainda não foram compactados. Isso reduz a E/S de disco e rede e aumenta o desempenho. Não é preciso compactar arquivos manualmente ou modificar aplicativos na compactação. Gravações/leituras aleatórias também são eficientes, pois somente os blocos necessários são descompactados com o recurso de divisão de arquivos.
  • Desempenho: o MapR apresenta uma arquitetura avançada que oferece uma maior eficiência e paralelismo, reduzindo a E/S da rede e do disco. O MapR mantém registros universais sobre o desempenho.


A edição M7 é uma distribuição completa do Apache Hadoop que fornece facilidade de uso, confiabilidade e vantagens de desempenho para aplicativos NoSQL e Hadoop. O M7 resolveu os problemas que as organizações enfrentam quando vão implementar uma solução NoSQL. O M7 oferece uma consistência forte e escalável, confiabilidade e baixa latência contínua com uma arquitetura que não exige compactações ou verificações de consistência em plano de fundo.

A edição M5 também é uma distribuição completa para o Apache Hadoop que fornece recursos corporativos para todas as operações de arquivos no Hadoop. Os recursos incluem espelhamento, snapshots, NFS HA, controle de disposição de dados, e muito mais. Todos são muito necessários para ambientes críticos para a missão.

A edição M3 é a versão gratuita de nossa distribuição completa para Hadoop. A edição M3 oferece uma plataforma de leitura/gravação aleatória que oferece suporte às interfaces padrão do setor (por exemplo, NFS, ODBC) e fornece vantagens de gerenciamento, compactação e desempenho.

Recurso MapR Edição M7 Edição M5 Edição M3
Distribuição completa para Apache Hadoop
Acesso direto NFS
Escala ilimitada
Desempenho recorde mundial
MapR Control System (MCS – Sistema de Controle do MapR)
Gerenciamento de dados baseado em volume  
Alta disponibilidade sem NameNode  
Alta disponibilidade do JobTracker  
Snapshots para arquivos  
Espelhamento para arquivos  
Atualizações de acumulação  
Recuperação instantânea para aplicativos HBase    
Administração HBase zero
   
Baixa latência contínua para HBase    
Snapshots para HBase    
Espelhamento para HBase    

O EMR Developer Guide inclui instruções detalhadas de como executar o MapR no EMR usando o AWS Management Console, interface de linha de comando ou API. Para executar um cluster do MapR usando o AWS Management Console:

  1. Acesse o serviço EMR no AWS Management Console.
  2. Clique em Create New Job Flow para iniciar o assistente de criação de novo fluxo de trabalho. Esse assistente executará o cluster do MapR.
  3. Selecione MapR M7, M5 ou M3 na lista suspensa Hadoop Version, no painel Define Job Flow do assistente.
  4. Siga as etapas restantes do assistente para executar seu fluxo de trabalho.

Os clientes do AWS Premium Support podem entrar em contato com a Amazon sobre qualquer problema relacionado ao MapR no EMR.

Usuários do M5 e M7 também podem entrar em contato com o suporte 24 horas da MapR diretamente, enviando um e-mail para support@mapr.com. Todos os usuários da MapR podem publicar perguntas nos Fóruns da MapR, que são continuamente monitorados pela MapR.


O Amazon Elastic MapReduce e o Amazon EMR são marcas comerciais da Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.