implementazione di riferimento

Data Lake Foundation su AWS

Utilizzo di servizi AWS, tra cui Amazon Redshift, Amazon Kinesis, AWS Glue e Amazon SageMaker

Questa soluzione implementa un data lake foundation che integra servizi Amazon Web Services (AWS) quali Amazon Simple Storage Service (Amazon S3), Amazon Redshift, Amazon Kinesis, Amazon Athena, AWS Glue, Amazon Elasticsearch Service (Amazon ES), Amazon SageMaker e Amazon QuickSight.

Il data lake foundation utilizza questi servizi AWS per fornire funzionalità come invio di dati, elaborazione di acquisizioni, gestione di set di dati, trasformazione e analisi dei dati, strumenti di creazione e distribuzione di machine learning, ricerca, pubblicazione e visualizzazione. Quando si verifica questo foundation, puoi scegliere di aumentare il data lake con strumenti ISV e SaaS.

L'architettura di riferimento è automatizzata grazie a modelli di AWS CloudFormation personalizzabili per soddisfare i tuoi requisiti.

Questa soluzione è stata sviluppata da AWS.

  •  Attività che realizzerai
  • Questa soluzione configura quanto segue:

    • Un cloud privato virtuale (VPC), che copre due zone di disponibilità e include due sottoreti pubbliche e due private.*
    • Un Internet gateway per offrire accesso a Internet.*
    • Nelle sottoreti pubbliche, gateway NAT (Network Address Translation) gestiti per consentire l’accesso a Internet in uscita alle risorse delle sottoreti private.*
    • Nelle sottoreti pubbliche, un bastion host di Linux in un gruppo Auto Scaling per consentire accesso SSH (Secure Shell) in entrata alle istanze EC2 all’interno delle sottoreti pubbliche e private.*
    • I ruoli di AWS Identity and Access Management (IAM) per fornire permessi per accedere alle risorse di AWS, ad esempio, per consentire ad Amazon Redshift e Amazon Athena di leggere e scrivere gruppi di dati curati.
    • Nelle sottoreti private, Amazon Redshift per aggregazione, analisi, trasformazione di dati e creazione di nuovi set di dati curati e pubblicati.
    • Un’istanza di Amazon SageMaker, accessibile mediante autenticazione AWS.
    • Integrazione con altri servizi Amazon quali Amazon S3, Amazon Athena, AWS Glue, AWS Lambda, Amazon ES con Kibana, Amazon Kinesis e Amazon QuickSight.

    * Il modello che implementa la soluzione su un VPC esistente non include le attività contrassegnate con asterisco e richiede la configurazione del VPC esistente.

  •  Come effettuare l'implementazione
  • Per implementare questa soluzione, segui le istruzioni nella guida all'implementazione, che include queste fasi.

    1. Accedi all'account AWS. Se non hai un account AWS, registrati su https://aws.amazon.com.
    2. Avvia la soluzione. L'implementazione dello stack richiede circa 50 minuti. Prima di creare lo stack, scegli la regione AWS dalla barra degli strumenti in alto. Scegli una delle seguenti opzioni:
    3. Effettua il test dell'implementazione verificando le risorse create dalla soluzione.

    La soluzione include parametri personalizzabili. Ad esempio, puoi configurare la tua rete o personalizzare le impostazioni di Amazon Redshift, Kinesis ed Elasticsearch.  

    Amazon può condividere informazioni relative all'implementazione con il Partner AWS che ha collaborato con AWS a questa soluzione.  

  •  Costi e licenze
  • Verranno addebitati i costi dei servizi AWS e di qualsiasi licenza di terze parti utilizzati per eseguire questa soluzione. Non sono previsti costi aggiuntivi per l'utilizzo della soluzione.

    Questa soluzione include alcuni parametri di configurazione personalizzabili. Alcune di queste impostazioni, ad esempio il tipo di istanza, incideranno sul costo dell'implementazione. Per una stima dei costi di ogni servizio AWS utilizzato, consulta la pagina dei prezzi. I prezzi sono soggetti a modifiche.

    Suggerimento: dopo l'implementazione della soluzione, crea report di costi e utilizzo di AWS per monitorare i costi associati. Questi report forniscono i parametri di fatturazione a un bucket Amazon Simple Storage Service (Amazon S3) nel tuo account. Inoltre, essi forniscono i costi stimati in base al consumo con cadenza mensile e aggregano i dati alla fine del mese. Per ulteriori informazioni, consulta Che cosa sono i report di costi e utilizzo AWS?
  •  Risorse
  • Questa soluzione è correlata a una soluzione presente in Solution Space che include una descrizione della soluzione, offerte di consulenza opzionali realizzate dai partner con competenza AWS e co-investimento AWS in progetti proof of concept (PoC). Per ulteriori informazioni, consulta Solution Space.