Cloud AWS
Nozioni di base su Amazon Redshift

I dati e la relativa analisi sono diventati fattori critici per garantire la competitività delle aziende. Report, pannelli di controllo e strumenti di analisi sono indispensabili per estrarre informazioni approfondite dai dati, monitorare le prestazioni aziendali e supportare il decision making. Questi report, pannelli di controllo e strumenti di business intelligence sono basati sui data warehouse, che memorizzano dati in modo efficiente per ridurre l'I/O al minimo e distribuire risultati di query con la massima rapidità a migliaia di utenti simultaneamente.

Scarica il whitepaper: Enterprise Data Warehousing on AWS

Un data warehouse funziona come un repository centralizzato di tutte le informazioni provenienti da una o più origini dati. I dati affluiscono nel data warehouse da sistemi transazionali e altri database relazionali; in genere includono dati strutturati, non strutturati e parzialmente strutturati. Questi dati vengono elaborati, trasformati e acquisiti a cadenza regolare. Gli utenti di questo flusso, in particolare data scientist, analisti aziendali e responsabili delle decisioni, accedono ai dati elaborati nel data warehouse utilizzando strumenti di business intelligence, client SQL e fogli di lavoro.

 

  Data warehouse Database transazionale
Carichi di lavoro consigliati Analisi, Big Data Elaborazione di transazioni
Tipi di operazioni Ottimizzato per operazioni di lettura e scrittura in batch su elevati volumi di dati per ridurre al minimo operazioni I/O e potenziare throughput di dati Ottimizzato per operazioni di scrittura continue ed elevati volumi di operazioni di lettura di piccole dimensioni per potenziare il throughput transazionali
Normalizzazione dei dati Impiega schemi non normalizzati quali Star e Snowflake Impiega schemi a normalizzazione elevata, più idonei per operazioni con requisiti di throughput transazionali elevati
Storage Richiede storage a colonne o altri tipi di storage specializzati Database basati su righe che memorizzano righe intere in un blocco fisico

AWS consente di sfruttare tutti i vantaggi dell'elaborazione on demand, ad esempio l'accesso a storage e capacità di elaborazione praticamente illimitati, con la possibilità di ricalibrare le risorse di sistema in base ai volumi di dati raccolti, memorizzati e interrogati, pagando solo per le risorse allocate. AWS offre inoltre un'ampia gamma di servizi gestiti che si integrano l'uno con l'altro, consentendo di distribuire in modo rapido soluzioni di analisi e data warehousing complete.

La figura seguente mostra i passaggi chiave di un processo di analisi e i servizi gestiti disponibili in AWS per ciascuna fase:

Pipeline di analisi in AWS

Amazon Redshift è una soluzione di data warehousing rapida, intuitiva e completamente gestita. Automatizza il provisioning dell'infrastruttura e le attività amministrative come backup, repliche e applicazioni di patch. Poiché si integra perfettamente con strumenti di BI e ETL di terza parte, puoi ottenere il tuo primo report in pochi minuti. Inoltre non è prevista alcuna limitazione alla quantità di dati che puoi caricare a analizzare. Man mano che i tuoi dati aumentano, non devi preoccuparti di costosi aggiornamenti di sistema o del rallentamento delle prestazioni. Redshift è una soluzione a prestazioni elevate perché impiega storage a colonne e altri sistemi di ottimizzazione. Amazon Redshift è inoltre economico, perché i prezzi sono calcolati solo in base all'uso effettivo. Puoi permettere a un numero illimitato di utenti di eseguire analisi sui dati, investendo solo 1.000 USD per terabyte all'anno. Ulteriori informazioni