Erste Schritte mit dem Projekt

5 Schritte  |  60 Minuten

Analyze_Big_Data_HERO-ART_SM

F: Was ist Amazon EMR?

Amazon EMR ist ein verwalteter Hadoop-Service, der es Ihnen ermöglicht, die neuesten Versionen beliebter Big Data-Frameworks, wie etwa Apache Spark, Presto, Hbase, Hive und weitere, auf voll anpassbaren Clustern auszuführen. Mit Amazon EMR erhalten Sie die volle Kontrolle über die Konfiguration Ihrer Cluster und die darauf installierte Software.

F: Was kann ich mit Amazon EMR tun?

Mithilfe von Amazon EMR können Sie beliebte Open Source-Frameworks wie Hadoop und Spark mit so viel oder so wenig Kapazität wie gewünscht unverzüglich bereitstellen, um datenintensive Aufgaben auszuführen. Zu den häufigen Anwendungsfällen gehören Web-Indizierung, Data Mining, Protokolldateianalyse, Extract-Transform-Load (ETL), Machine Learning, Finanzanalysen, wissenschaftliche Simulationen und Bioinformatik-Forschungen. Mit Amazon EMR können Sie sich auf das Zerlegen oder Analysieren Ihrer Daten konzentrieren, ohne sich über die zeitraubende Einrichtung, Verwaltung oder Optimierung von Hadoop-Clustern beziehungsweise die Rechenkapazität, auf der diese aufsetzen, kümmern zu müssen.

Amazon EMR eignet sich hervorragend für Prozesse, die eine schnelle und effiziente Verarbeitung großer Datenmengen erfordern. Auf der Web-Service-Oberfläche können Verarbeitungs-Workflows erstellt sowie der Fortschritt von ausgeführten Clustern überwacht werden. Außerdem können Sie die einfache Web-Oberfläche der AWS Management Console verwenden, um Ihre Cluster zu starten und verarbeitungsintensive Berechnungen zu überwachen.

F: Kann ich dieses Projekt verwenden, um meine eigenen Protokolle zu analysieren?

Ja. Sie können Ihre eigenen Datenprotokolle in einen Amazon S3-Bucket hochladen und einen ähnlichen Cluster verwenden, um Abfragen für Ihre eigenen Daten auszuführen. Beachten Sie aber, dass dieses Projekt nicht für Produktionsumgebungen gedacht ist.

F: Wie importiere ich Daten in Amazon S3?
Über die AWS Management Console können Sie einfach und sicher Buckets erstellen, Objekte hochladen und Zugriffskontrollen einstellen. Im Handbuch Erste Schritte zu Amazon S3 erfahren Sie, wie Sie über die AWS Management Console mit Amazon S3 arbeiten.

Amazon S3 wird außerdem in eine Vielzahl anderer AWS-Services und Konnektoren von Drittanbietern integriert, um Daten zur und von der Cloud zu übertragen. Weitere Informationen zu Tools für die Datenmigration in die Cloud.

F: Wie sicher sind meine Daten?

Amazon S3 ist standardmäßig sicher. Generell haben nur die Bucket- und Objekt-Besitzer Zugang zu ihren selbst erstellen Amazon-S3-Ressourcen. Amazon S3 unterstützt Funktionen zur Benutzerauthentifizierung, um den Zugriff auf die Daten zu kontrollieren. Über SSL-Endpunkte, die das HTTPS-Protokoll verwenden können Sie sicher Ihre Daten in Amazon S3 hoch- bzw. herunterladen. Sie können mithilfe von AWS Identity and Access Management-Tools (IAM) den Zugriff und die Berechtigungen regeln, etwa mit IAM Users and Roles. So können Sie bestimmten Benutzern Lese-, aber keinen Schreibzugriff auf Ihre Cluster gewähren. Darüber hinaus können Sie Amazon EMR-Sicherheitskonfigurationen verwenden, um verschiedene Verschlüsselungsoptionen für Daten im Ruhezustand und während der Übertragung festzulegen, darunter auch Unterstützung für die Amazon S3-Verschlüsselung. Weitere Informationen zur Steuerung des Zugriffs auf Ihren Cluster und Amazon EMR-Verschlüsselung.

Erste Schritte mit dem Projekt