distribuzione di riferimento

Architettura modulare per Amazon Redshift

Distribuisci un data warehouse Amazon Redshift nell'AWS Cloud per big data e analisi

Questo Quick Start distribuisce in modo automatico un ambiente modulare e a elevata disponibilità per Amazon Redshift sul cloud Amazon Web Services (AWS).

Amazon Redshift è una soluzione di data warehousing rapida e completamente gestita che semplifica e riduce i costi dell'analisi di dati utilizzando il linguaggio SQL (Structured Query Language) standard e gli strumenti di business intelligence (BI) già esistenti. Questo servizio consente di eseguire query di analisi complesse su petabyte di dati strutturati utilizzando sofisticati sistemi di ottimizzazione delle query, archiviazione a colonne su dischi locali ad alte prestazioni e query in parallelo di grandi volumi di dati.   

L’amministrazione dei data warehouse tradizionali richiede un notevole dispendio di tempo e risorse, specialmente nel caso di set di dati di grandi dimensioni. I costi finanziari associati alla realizzazione, alla manutenzione e all’espansione dei data warehouse locali gestiti autonomamente sono inoltre molto elevati. Amazon Redshift non solo riduce significativamente i costi e il carico operativo di un data warehouse ma, grazie a Redshift Spectrum, rende l'analisi di grandi volumi di dati in formato nativo un'operazione semplice, eliminando la necessità di eseguire caricamenti.

logo portworx

Questo Quick Start è stato sviluppato da AWS.


Gli amministratori di AWS Service Catalog possono aggiungere questa architettura al proprio catalogo.  

  •  Attività che realizzerai
  • Usa questo Quick Start per configurare automaticamente il seguente ambiente Amazon Redshift su AWS:

    • Un'architettura del cloud privato virtuale (VPC, Virtual Private Cloud) altamente disponibile che si estende su due zone di disponibilità. Il VPC è configurato con sottoreti pubbliche e private secondo le best practice AWS per creare la tua rete virtuale personale in AWS.*
    • Nelle sottoreti pubbliche:
      • Gateway NAT (Network Address Translation) gestiti che consentono l'accesso Internet in uscita alle risorse nelle sottoreti private.*
      • Nelle sottoreti pubbliche un bastion host Linux in un gruppo Auto Scaling per consentire l'accesso SSH (Secure Shell) in ingresso alle istanze di Amazon Elastic Compute Cloud (Amazon EC2) nelle sottoreti pubbliche e private.*
    • In una sottorete privata, un cluster Amazon Redshift e le relative componenti, quali un gruppo di sottoreti del cluster, un gruppo di parametri, la gestione del carico di lavoro e un gruppo di sicurezza che consente l'accesso al VPC. Questo è il comportamento predefinito. Tuttavia, puoi anche scegliere di creare il cluster e le relative componenti nelle sottoreti pubbliche, per renderli pubblicamente accessibili.
    • Un bucket Amazon Simple Storage Service (Amazon S3) per i log di audit.
    • Un endpoint VPC per Amazon S3, per garantire ad Amazon Redshift e ad altre risorse AWS eseguite in una sottorete privata un accesso controllato ai bucket di Amazon S3.
    • Quick Start utilizza un chiave di AWS Key Management Service (AWS KMS) per consentire la crittografia a riposo per il cluster di Amazon Redshift e crea una chiave master predefinita quando non vengono definite altre chiavi. 
    • Allarmi Amazon CloudWatch per monitorare la CPU nei bastion host, controllare la CPU e lo spazio su disco del cluster Amazon Redshift e per inviare una notifica Amazon SNS quando viene attivato l'allarme.
    • Un ruolo AWS Identity and Access Management (IAM) che garantisce le autorizzazioni minime richieste per utilizzare Redshift Spectrum con Amazon S3, Amazon CloudWatch Logs, AWS Glue e Amazon Athena.
    • AWS Glue Catalog come store di metadati.

    *  Il modello che distribuisce il Quick Start su un VPC esistente non include i componenti contrassegnati con asterisco e richiede la configurazione del VPC esistente.

  •  Come effettuare la distribuzione
  • Per implementare l'ambiente Amazon Redshift nel tuo account AWS, segui le istruzioni nella guida all'implementazione. Il processo di implementazione richiede 10-15 minuti e comprende le seguenti fasi:

    1. Se non disponi già di un account AWS, registrati su https://aws.amazon.com e accedi al tuo account.
    2. Avvia Quick Start scegliendo tra le seguenti opzioni:
    3. Verifica la distribuzione e conferma che il cluster Amazon Redshift e il bastion host Linux stanno accettando le connessioni.
     
    Per personalizzare la distribuzione, puoi configurare VPC, bastion host e impostazioni di database, nonché impostare tag per database se lo desideri.

    Amazon può condividere informazioni relative all'implementazione con il Partner AWS che ha collaborato con AWS a questa soluzione.  

  •  Costi e licenze
  • Ti saranno addebitati i costi dei servizi AWS utilizzati per eseguire questa distribuzione di riferimento Quick Start. Non sono previsti costi aggiuntivi per l'utilizzo del Quick Start.

    I modelli di AWS CloudFormation per questo Quick Start comprendono alcuni parametri di configurazione personalizzabili. Alcune di queste impostazioni, ad esempio il tipo di istanza del database, incideranno sul costo della distribuzione. Per una stima dei costi, consulta la pagina dei prezzi di ciascuno dei servizi AWS che intendi utilizzare. I prezzi sono soggetti a modifiche.

    Suggerimento: dopo l'implementazione di Quick Start, si raccomanda di abilitare il Report costi e utilizzo AWS per monitorare i costi associati al Quick Start. Questo report invia i parametri di fatturazione in un bucket del Servizio di archiviazione semplice Amazon (Amazon S3) nel tuo account. Il report fornisce con cadenza mensile i costi stimati in base al consumo e aggiorna i dati al termine del mese. Per maggiori informazioni sul report, consulta la documentazione AWS.