Inizia il progetto

5 fasi  |  60 minuti

Analyze_Big_Data_HERO-ART_SM

D: Cos'è Amazon EMR?

Amazon EMR è un servizio Hadoop gestito che permette di eseguire le versioni più recenti di framework di Big Data comuni come Apache Spark, Presto, Hbase, Hive e altri su cluster completamente personalizzabili. Amazon EMR consente di controllare completamente la configurazione dei cluster e il software installato su di essi.

D: Cosa è possibile fare con Amazon EMR?

Usando Amazon EMR, puoi effettuare il provisioning in modo immediato di framework open source comuni come Hadoop e Spark con tutta la capacità che ti occorre per completare i processi a elevato traffico di dati. I casi d’uso più comuni sono indicizzazione Web, data mining, analisi di file di log, operazioni di estrazione, trasformazione e caricamento dei dati o ETL, apprendimento automatico, analisi finanziarie, simulazioni scientifiche e ricerche bioinformatiche. Amazon EMR ti consente di concentrare l'attenzione sull'elaborazione o l'analisi dei dati, senza doverti occupare di altre attività laboriose quali configurazione, gestione e ottimizzazione dei cluster Hadoop o della capacità di elaborazione da usare.

Amazon EMR è ideale per problemi che richiedono una rapida ed efficiente elaborazione di grandi volumi di dati. Grazie all'interfaccia di servizi Web, puoi creare il flusso di lavoro di elaborazione e monitorare programmaticamente l'andamento dei cluster in esecuzione. Inoltre, puoi usare la semplice interfaccia Web della Console di gestione AWS per avviare i cluster e monitorare le operazioni di calcolo più onerose.

D: Posso usare questo progetto per analizzare i miei log?

Sì. Puoi caricare i tuoi log di dati in un bucket Amazon S3 e usare un cluster simile per eseguire query sui tuoi dati. Ti preghiamo tuttavia di notare che questo progetto non è stato pensato per ambienti di produzione.

D: Come si caricano i dati in Amazon S3?
Questa console consente di creare bucket, caricare oggetti e impostare i controlli di accesso con la massima semplicità e sicurezza. La Getting Started Guide di Amazon S3 illustra come iniziare a utilizzare la Console di gestione AWS con Amazon S3.

Amazon S3 si integra anche con diversi servizi di AWS e connettori di terze parti per semplificare i trasferimenti di dati da e verso il cloud. Ulteriori informazioni sugli strumenti per la migrazione dei dati nel cloud.

D: Qual è il livello di sicurezza dei dati?

La sicurezza è una delle caratteristiche primarie di Amazon S3. Solo i proprietari del bucket e degli oggetti hanno accesso in origine alle risorse Amazon S3 che creano. Amazon S3 è provvisto di funzionalità di autenticazione per controllare l'accesso ai dati. È possibile caricare o scaricare in modo sicuro i propri dati su Amazon S3 tramite endpoint crittografati con SSL impiegando protocolli HTTPS. Puoi usare gli strumenti di AWS Identity and Access Management (IAM), ad esempio IAM Users and Roles, per tenere sotto controllo accessi e autorizzazioni. Ad esempio, puoi autorizzare un determinato utente ad accedere in lettura ma non in scrittura ai cluster. Inoltre, è possibile usare le configurazioni di sicurezza di Amazon EMR per impostare le opzioni di crittografia su dati inattivi o in transito, con supporto per la crittografia di Amazon S3. Ulteriori informazioni sul controllo degli accessi al cluster e sulla crittografia di Amazon EMR.

Inizia il progetto