Inizia il progetto

5 fasi  |  60 minuti

Analyze_Big_Data_HERO-ART_SM

Amazon EMR è un servizio gestito che consente di eseguire Apache Hadoop e Spark in modo rapido, facile e conveniente per elaborare grandi quantità di dati. Amazon EMR supporta inoltre molti strumenti noti e affidabili per Hadoop, tra cui Presto, Hive, Pig, HBase e altri. Questo progetto prevede la distribuzione di un cluster Hadoop pienamente funzionale, pronto ad analizzare dati di log in pochi minuti. Per cominciare, si deve lanciare un cluster Amazon EMR e poi utilizzare uno script HiveQL per elaborare esempi di dati di log memorizzati in un bucket Amazon S3. HiveQL è un linguaggio di script simile a SQL per data warehousing e analisi. In seguito puoi usare una configurazione simile per analizzare i tuoi file di log.

aws-project_analyze-big-data_diagram
Inizia il progetto

Al termine sarai in grado di:

Avviare un cluster Hadoop pienamente funzionale utilizzando Amazon EMR.

Definire lo schema e creare una tabella per esempi di dati di log memorizzati in Amazon S3.

Analizzare i dati con uno script HiveQL e trascriverne i risultati in Amazon S3.

Scaricare e visualizzare i dati sul tuo computer.

Cosa occorre prima di iniziare:

Un account AWS: per avviare il provisioning delle risorse per l’hosting del tuo sito Web è necessario un account AWS. Registrati ad AWS.

Esperienza IT: per portare a termine questo progetto, un'esperienza di utilizzo di Hadoop è preferibile ma non necessaria.

Esperienza con AWS: per portare a termine questo progetto, delle nozioni di base su Amazon S3 e le coppie di chiavi Amazon EC2 sono consigliate ma non necessarie.

Costo stimato:

Costo della realizzazione del progetto: il costo stimato per portare a termine questo progetto è 1,05 USD, purché si rimanga entro i limiti del Piano gratuito di AWS, si utilizzino le configurazioni consigliate e che tutte le risorse utilizzate nel progetto vengano terminate entro un'ora dalla creazione. Il tuo caso d'uso può richiedere configurazioni diverse che possono incidere sul costo. Usa il Calcolatore di costo mensile per stimare i costi in base alle tue necessità.

Costo mensile stimato: il costo totale per l'esecuzione di questo progetto varia a seconda dell'utilizzo e della configurazione. Utilizzando la configurazione predefinita consigliata in questa guida, il costo per questo progetto è normalmente di 769 USD al mese. Le tariffe di AWS si basano sull'utilizzo effettivo di ciascun servizio. La fattura mensile è composta dalla somma dei costi di tutti i servizi utilizzati. Esplora le schede di seguito per scoprire l'utilizzo e il costo di ciascun servizio. Per consultare in dettaglio i servizi utilizzati e i relativi costi, consulta la sezione Servizi impiegati e costi.


Ulteriori informazioni sulle soluzioni di Big Data in AWS e per iscriversi a un webinar.

Informazioni sulle caratteristiche, i vantaggi e i casi d'uso principali di Amazon EMR.

Desideri più risorse per iniziare a usare AWS? Per ulteriori informazioni, visita il centro risorse per le nozioni di base.