Commencer le projet

5 étapes | 60 minutes

Analyze_Big_Data_HERO-ART_SM

Q : Qu'est-ce qu'Amazon EMR ?

Amazon EMR est un service Hadoop géré qui vous permet d'exécuter les dernières versions de frameworks Big Data courants tels qu'Apache Spark, Presto, HBase, Hive et bien plus encore, sur des clusters entièrement personnalisables. Amazon EMR vous permet de contrôler entièrement la configuration de vos clusters et les logiciels installés sur ceux-ci.

Q : Que puis-je faire avec Amazon EMR ?

En utilisant Amazon EMR, vous pouvez configurer instantanément des frameworks open source courants tels que Hadoop et Spark, avec la capacité que vous souhaitez, pour réaliser des tâches à forte intensité de données. Les cas d'utilisation courants comprennent l'indexation Web, l'exploration de données, l'analyse de journaux, l'ETL (extraction, transformation et chargement), l'apprentissage-machine, l'analyse financière, la simulation scientifique et la recherche bio-informatique. Amazon EMR vous permet de vous concentrer sur la lecture à grande vitesse ou l'analyse de vos données sans avoir à vous soucier de l'installation, de la gestion ou du réglage des clusters Hadoop, ou encore de la capacité de calcul sous-jacente.

Amazon EMR est idéal pour les problèmes dont la résolution nécessite le traitement rapide et efficace de grandes quantités de données. Les interfaces de service Web vous permettent de créer des flux de travail de traitement et de surveiller via un programme l'avancement des clusters en cours d'exécution. De plus, vous pouvez utiliser l'interface Web simple d'AWS Management Console pour lancer vos clusters et surveiller les calculs à forte intensité de traitement.

Q : Puis-je utiliser ce projet pour analyser mes propres journaux ?

Oui. Vous pouvez charger vos propres journaux de données dans un compartiment Amazon S3 et utiliser un cluster semblable pour exécuter des requêtes sur vos propres données. Cependant, ce projet n'est pas destiné à des environnements de production.

Q : Comment puis-je transférer mes données vers Amazon S3 ?
Vous pouvez facilement, et de façon sécurisée, créer des compartiments, télécharger des objets et définir des contrôles d'accès en utilisant AWS Management Console. Le manuel Amazon S3 Getting Started vous explique comment utiliser AWS Management Console avec Amazon S3.

Amazon S3 est également intégré à différents services AWS et à des connecteurs tiers pour vous aider à transférer des données depuis et vers le cloud. En savoir plus sur les outils de migration de données vers le cloud.

Q : Quel est le niveau de sécurité de mes données ?

Amazon S3 est sécurisé par défaut. Seul les propriétaires du compartiment et de l'objet ont originellement accès aux ressources Amazon S3 qu'ils créent. Amazon S3 supporte l'authentification d'utilisateur pour contrôler l'accès aux données. Vous pouvez télécharger de manière sécurisée vos données sur ou depuis Amazon S3 par le biais des points de terminaison SSL utilisant le protocole HTTPS. Vous pouvez utiliser les outils d'AWS Identity and Access Management (IAM), tels que les utilisateurs et les rôles IAM, pour contrôler les accès et les autorisations. Par exemple, vous pouvez autoriser un accès à vos clusters en lecture seule à certains utilisateurs, mais pas d'accès en écriture. Vous pouvez également utiliser les configurations de sécurité Amazon EMR pour définir différentes options de chiffrement au repos et en transit, notamment la prise en charge du chiffrement Amazon S3. Apprenez en plus sur le contrôle de l'accès à votre cluster et le chiffrement Amazon EMR.

Commencer le projet