implementazione di riferimento

Databricks in AWS

Uno spazio di lavoro collaborativo per data science, machine learning e analisi

Questa soluzione del partner è pensata per amministratori, professionisti DevOps e architect dell'infrastruttura IT che desiderano utilizzare l'API Databricks per creare spazi di lavoro Databricks nel cloud Amazon Web Services (AWS). Questa soluzione del partner crea un nuovo spazio di lavoro nel tuo account AWS e configura l'ambiente per implementare altri spazi di lavoro in futuro.

Databricks è una piattaforma unificata di analisi dei dati per ingegneria dei dati, machine learning e data science collaborativa. Uno spazio di lavoro Databricks è un ambiente software-as-a-service (SaaS) per l'accesso a tutti gli asset Databricks. Lo spazio di lavoro organizza gli oggetti (ad esempio notebook, librerie ed esperimenti) in cartelle e fornisce l'accesso ai dati e alle risorse computazionali, come cluster e processi.

Importante: per implementare questa soluzione del partner AWS è necessario che il tuo account Databricks disponga della versione E2 della piattaforma. Per ulteriori informazioni, contatta Databricks.
Visualizza i contenuti correlati

Questa soluzione del partner è stata creata da Databricks in collaborazione con AWS. Databricks è un partner AWS.

  •  Attività che realizzerai
  • La soluzione del partner configura quanto segue, che costituisce lo spazio di lavoro Databricks:

    • Un'architettura a elevata disponibilità che comprende almeno tre zone di disponibilità.
    • Un Virtual Private Cloud (VPC) gestito da Databricks o dal cliente nell'account AWS del cliente. Il VPC è configurato con sottoreti pubbliche e private secondo le best practice AWS, per creare la tua rete virtuale personale in AWS.
    • Nelle sottoreti private:
      • Cluster Databricks di istanze Amazon Elastic Compute Cloud (Amazon EC2).
      • Uno o più gruppi di sicurezza per abilitare la connettività sicura del cluster.
    • Nella sottorete pubblica:
      • Un gateway NAT (Network Address Translation) per consentire l'accesso Internet in uscita.
    • Amazon CloudWatch per i log dell'istanza dello spazio di lavoro Databricks.
    • (Opzionale) Una chiave AWS Key Management Service (AWS KMS) gestita dal cliente per crittografare i notebook.
    • Un bucket Amazon Simple Storage Service (Amazon S3) per archiviare oggetti come log di cluster, revisioni di notebook e risultati di processi.
    • AWS Security Token Service (AWS STS) per consentirti di richiedere credenziali temporanee a privilegio limitato per l'autenticazione degli utenti.
    • Un endpoint VPC per l'accesso agli artefatti e ai log S3.
    • Un ruolo AWS Identity and Access Management (IAM) tra più account per consentire a Databricks di distribuire cluster nel VPC per il nuovo spazio di lavoro. A seconda dell'opzione di distribuzione scelta, crei questo ruolo IAM durante la distribuzione o utilizzi un ruolo IAM esistente.
  •  Come eseguire l'implementazione
  • Per distribuire Databricks, segui le istruzioni nella guida alla distribuzione. Databricks deve accedere a un ruolo IAM tra più account nel tuo account AWS per avviare i cluster nel VPC del nuovo spazio di lavoro. Il processo di distribuzione richiede circa 15 minuti e comprende i seguenti passaggi:

    1. Se non disponi ancora di un account AWS, registrati su https://aws.amazon.com e accedi al tuo account.
    2. Avvia la soluzione dei partner scegliendo una delle seguenti opzioni:

    Amazon può condividere informazioni relative all'implementazione con il Partner AWS che ha collaborato con AWS a questa soluzione.  

  •  Costi e licenze
  • Verrà addebitato il costo dei servizi AWS usati durante l'esecuzione della soluzione del partner. L'utilizzo della soluzione del partner non prevede costi aggiuntivi.

    Il modello AWS CloudFormation per questa soluzione del partner include alcuni parametri di configurazione personalizzabili. Alcune delle impostazioni, ad esempio il tipo di istanza, incideranno sul costo dell'implementazione. Per una stima dei costi di ogni servizio AWS utilizzato, consulta la pagina dei prezzi. I prezzi sono soggetti a modifiche.

    Suggerimento: dopo avere implementato la soluzione del partner, abilita il Report di costi e utilizzo AWS per inviare i parametri di fatturazione a un bucket Amazon S3 nel tuo account. Il report fornisce con cadenza mensile i costi stimati in base al consumo e aggrega i dati al termine del mese. Per ulteriori informazioni, consulta la pagina Che cosa sono i Report di costi e utilizzo AWS?

    Per le stime dei costi di Databricks, consulta la rispettiva pagina dei prezzi per i livelli e le caratteristiche del prodotto.

Testimonianze di successo dei partner
Databricks semplifica l'implementazione utilizzando la soluzione del partner AWS

Quando Databricks ha dovuto affrontare la sfida di ridurre i passaggi di configurazione complessi e il tempo necessario per l'implementazione degli spazi di lavoro Databricks nel cloud AWS, ha collaborato con il team di integrazione e automazione di AWS per progettare una soluzione del partner AWS, un'architettura di riferimento automatizzata creata sui modelli AWS CloudFormation con best practice integrate. 

Leggi la documentazione di riferimento completa del partner
Torna all'inizio