Amazon EMR facilite la mise en service et la gestion d'Hadoop dans le cloud AWS. Hadoop est disponible dans plusieurs distributions et Amazon EMR vous donne la possibilité d'utiliser soit la distribution Amazon, soit la distribution MapR pour Hadoop.

Avec MapR, Hadoop tient toutes ses promesses grâce à une plate-forme éprouvée de classe entreprise qui prend en charge un vaste éventail d'opérations critiques et d'utilisations en production en temps réel. MapR offre non seulement une fiabilité et une facilité d'utilisation incomparables, mais aussi un débit record vers les applications Hadoop, NoSQL, de base de données et de diffusion en continu au sein d'une plate-forme de Big Data unifiée. La solution MapR est plébiscitée parmi les services financiers, les détaillants, les administrations, les entreprises des secteurs des médias, de la santé, de la fabrication et des télécommunications, ainsi que par les leaders du classement Fortune 100 et du Web 2.0. Parmi les investisseurs figurent Lightspeed Venture Partners, Mayfield Fund, NEA et Redpoint Ventures. Rejoignez MapR sur Facebook, LinkedIn et Twitter.

Démarrez avec Amazon EMR

Créez un compte gratuit

Si vous avez besoin de traiter de gros volumes de données, des remises pourront vous être accordées.

Pour en savoir plus, n'hésitez pas à nous contacter.

mapr-280
  • Récupération instantanée : MapR M7 rend votre base de données hautement disponible. Le système effectue automatiquement une récupération en seulement quelques secondes en cas de défaillance d'un nœud, ce qui permet à votre application de continuer à s'exécuter sans problème.
  • Aucune tâche d'administration HBase : Avec MapR M7, il est possible d'utiliser les tables sans exécuter de services distincts, tels que RegionServer. De plus, M7 supprime les compactages et offre une fonction de division régionale en toute transparence, autant d'opérations que l'administrateur n'a plus à effectuer manuellement.
  • Faible latence permanente : MapR M7 fournit en permanence une faible latence en évitant la collecte ou le compactage de données erronées qui nuit aux performances. Un faible taux d'E/S sur disque et un plus petit format de disque accélèrent les opérations de base de données sur disque et les rendent plus prévisibles.
  • Protection complète des données avec les instantanés : M7 offre une protection complète des données pour HBase. Les instantanés permettent une récupération à un instant donné des tables afin de se prémunir contre les erreurs des utilisateurs ou des applications. M7 étend les instantanés afin d'inclure toutes les données, à savoir à la fois les fichiers et les tables. Les tables HBase peuvent être directement lues à partir des instantanés et immédiatement récupérées et ce, sans temps d'interruption, contrairement à la restauration des tables HBase dans les autres distributions.
  • Continuité de l'activité avec mise en miroir : La mise en miroir permet aux utilisateurs de répliquer automatiquement les données différentielles en temps réel sur les différents clusters. Cela permet de créer des solutions de reprise après sinistre pour les bases de données ou de fournir un accès en lecture seule aux données à partir d'emplacements multiples. M7 ne nécessite pas la reconstruction des processus RegionServer, il est donc possible de monter des bases de données en un instant sur le site en miroir dès que le site actif tombe en panne.
  • NFS : MapR fournit un accès en lecture/écriture aléatoire et une interface NFS standard. Les utilisateurs peuvent donc monter le cluster et exploiter des applications standard basées sur fichiers avec Hadoop, y compris des utilitaires Linux, des navigateurs de fichiers et des applications non Java. Lorsque MapR est utilisé sur Amazon EMR, l'interface NFS est prémontée sur /mapr.
  • ODBC : MapR fournit un lecteur ODBC pour Hive qui respecte la spécification ODBC 3.52 standard, permettant aux utilisateurs d'exécuter un outil BI ou un constructeur de requêtes SQL avec Hadoop. MicroStrategy, Tableau, Excel, Toad et divers autres outils commercialisés ou à code source libre sont pris en charge.
  • Déploiement : Amazon EMR avec MapR automatise entièrement la mise en service, l'installation et la configuration du cluster, lequel peut ensuite être lancé via AWS Management Console, l'interface de ligne de commande ou l'API.
  • MapR Control System (MCS) : MapR offre des fonctionnalités de gestion et de surveillance de bout en bout pour Hadoop, y compris pour le matériel, le stockage, MapReduce et les autres composants de la distribution.
  • Interface de ligne de commande et API REST : Toutes les fonctionnalités de MCS sont également utilisables via l'interface de ligne de commande et l'API REST. Les utilisateurs peuvent, ainsi, obtenir des informations sur les clusters et exécuter des opérations par programmation. Cela permet également l'intégration de systèmes de gestion/surveillance tiers et personnalisés.
  • Haute disponibilité du système de fichiers : MapR fournit une architecture non NameNode tolérant plusieurs pannes simultanées avec un basculement et une reprise automatiques. Les métadonnées sont distribuées et répliquées, tout comme les données. En l'absence d'architecture NameNode, il n'existe aucun restriction pratique au nombre de fichiers pouvant être stockés et aucune dépendance par rapport à un NAS externe.
  • Haute disponibilité MapReduce : MapR intègre JobTracker HA, avec basculement et reprise automatiques. Si l'instance JobTracker active échoue, elle est automatiquement lancée sur un autre nœud et toutes les tâches continuent de s'exécuter sans interruption.
  • Protection des données : MapR fournit des instantanés en vue d'effectuer des récupérations à un moment donné en cas d'erreur des utilisateurs ou des applications. MapR utilise la technologie RoW (Redirect-on-Write) et seuls les blocs modifiés font l'objet d'un instantané, ce qui limite l'impact sur les performances. Notez que la cohérence des instantanés est garantie et que toutes les applications sont donc prises en charge.
  • Reprise après sinistre : MapR permet la mise en miroir des clusters, ce qui autorise une reprise après sinistre sur différentes zones de disponibilité, ainsi que des déploiements hybrides impliquant à la fois des clusters sur site et des clusters EMR. Dans le cas de déploiements hybrides, toutes les distributions Hadoop basées sur MapR sont prises en charge, y compris Greenplum MR d'EMC et l'appliance UCS de Cisco. Notez que seuls les blocs modifiés sont transférés et que toutes les données sont automatiquement compressées.
  • Compression : MapR compresse de manière automatique et transparente toutes les données non déjà compressées. Cela réduit les E/S sur disque et réseau et accroît les performances. Il est donc inutile pour vous de compresser manuellement les fichiers ou de modifier vos applications afin de prendre en charge les compressions. Les lectures/écritures aléatoires sont également efficaces, car seuls les blocs requis sont décompressés avec la possibilité de scinder les fichiers.
  • Performances : MapR présente une architecture avancée offrant une meilleure efficacité et un parallélisme accrue, tout en réduisant les E/S sur disque et réseau. Les performances de MapR sont incomparables.


L'édition M7 est une distribution complète pour Apache Hadoop qui offre divers avantages en termes de facilité d'utilisation, fiabilité et performances pour les applications NoSQL et Hadoop. M7 permet aux entreprises souhaitant déployer une solution NoSQL de ne pas avoir à faire de compromis. M7 offre évolutivité, cohérence forte, fiabilité et faible latence permanente avec une architecture qui ne nécessite ni compactages ni vérifications en arrière-plan de la cohérence.

L'édition M5 est également une distribution complète pour Apache Hadoop qui offre des fonctionnalités de classe entreprise pour toutes les opérations réalisées sur les fichiers sur Hadoop. Ces fonctionnalités incluent, notamment, la mise en miroir, la capture d'instantanés, la haute disponibilité des systèmes de fichiers réseau et le contrôle du placement des données pour répondre aux besoins des environnements critiques les plus exigeants.

L'édition M3 est une version gratuite de notre distribution complète pour Hadoop. L'édition M3 offre une plate-forme prenant en charge les lectures-écritures entièrement aléatoires et les interfaces standard (NFS ou ODBC, par exemple), tout en fournissant des fonctionnalités de gestion et de compression, ainsi que des performances élevées.

Fonctionnalités MapR Edition M7 Edition M5 Edition M3
Distribution complète pour Apache Hadoop
Accès direct NFS
Evolutivité illimitée
Performances inégalées
MapR Control System (MCS)
Gestion de données basée sur les volumes  
Haute disponibilité non NameNode  
Haute disponibilité avec JobTracker HA  
Instantanés de fichiers  
Mise en miroir de fichiers  
Mises à niveau continues  
Récupération instantanée pour applications HBase    
Aucune tâche d'administration HBase
   
Faible latence permanente pour HBase    
Instantanés pour HBase    
Mise en miroir pour HBase    

Le manuel EMR Developer Guide inclut des instructions détaillées pour lancer MapR sur EMR via AWS Management Console, l'interface de ligne de commande ou les API. Pour lancer un cluster MapR à l'aide d'AWS Management Console :

  1. Accédez au service EMR sur AWS Management Console.
  2. Cliquez sur Create New Job Flow pour démarrer l'assistant de création de flux de travail. Cet assistant se chargera de lancer le cluster MapR.
  3. Sélectionnez MapR M7, M5 ou M3 dans la liste déroulante Hadoop Version figurant dans le volet Define Job Flow de l'assistant.
  4. Complétez les étapes suivantes de l'assistant pour lancer votre flux de travail.

Les clients bénéficiant d'AWS Premium Support peuvent contacter Amazon en cas de problème concernant MapR sur EMR.

Les utilisateurs des éditions M5 et M7 peuvent également contacter le support MapR 24h/24, 7j/7 en envoyant un e-mail à support@mapr.com. Tous les utilisateurs MapR peuvent poser des questions sur les forums MapR, qui font l'objet d'un suivi permanent par MapR.


Amazon Elastic MapReduce et Amazon EMR sont des marques déposées d'Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.