Cos’è un approccio lake house?

Integra perfettamente data lake, data warehouse e Datastore dedicati

Approccio lake house - come funziona

Un approccio lake house si basa sull’idea che un approccio indifferenziato all’analisi dei dati comporti dei compromessi. Non si tratta solo di integrare un data lake con un data warehouse, ma piuttosto di integrare un data lake, un data warehouse e degli archivi dedicati, assicurando una governance unificata e semplicità nel trasferimento dati. L’architettura lake house su AWS permette ai clienti di archiviare i dati in un data lake e utilizzare un insieme di servizi dati dedicati relativi al lake, permettendo di prendere decisioni in modo rapido, agile, su vasta scala e con un rapporto prezzo/prestazioni senza paragoni sul mercato.

Un’architettura lake house richiede che i clienti:

  • Costruiscano rapidamente dei data lake scalabili
  • Utilizzino una vasta e approfondita raccolta di servizi dati dedicati
  • Assicurino conformità utilizzando un metodo univoco per proteggere, monitorare e gestire l’accesso ai dati
  • Dimensionino i sistemi a prezzi contenuti senza compromettere le prestazioni
Come funziona - Approccio lake house

Perché è necessario un approccio lake house

I volumi dei dati aumentano a un ritmo senza precedenti, passando dai terabyte ai petabyte e a volte agli exabyte. Gli approcci tradizionali dell’analisi dei dati on-premise non sono in grado di gestire questi volumi di dati perché non assicurano una scalabilità ottimale e sono costosi. Molte aziende trasferiscono i dati da silos diversi e li raggruppano in una sola posizione, spesso definita data lake, per eseguire analisi dei dati e ML direttamente su quei dati. In altri casi, queste stesse aziende archiviano altri dati in Datastore dedicati per effettuare analisi e ottenere velocemente delle informazioni dettagliate da dati strutturati e non strutturati. Questo trasferimento dati può avvenire verso l’esterno, verso l’interno o attorno al perimetro perché i dati hanno un peso.

  • Verso l’esterno
  • Verso l’interno
  • Attorno al perimetro
  • Peso dei dati
  • Verso l’esterno
  • Trasferimento dati verso l’esterno

    I clienti archiviano i dati in un data lake e poi trasferiscono una parte di quei dati in un Datastore dedicato per eseguire ulteriori machine learning o analisi dei dati.

    Esempio: i dati clickstream dalle applicazioni Web possono essere raccolti direttamente in un data lake e una parte di quei dati può essere trasferita in un data warehouse per il report giornaliero. Questo concetto è considerato un trasferimento verso l’esterno.

    Trasferimento dati verso l’esterno
  • Verso l’interno
  • Trasferimento dati verso l’interno

    I clienti archiviano i dati in Datastore dedicati come un data warehouse o un database e li trasferiscono in un data lake per eseguire delle analisi su quei dati. 

    Esempio: i risultati di una query per la vendita di prodotti in una Regione specifica vengono copiati dal data warehouse nel data lake per eseguire algoritmi di suggerimento prodotti rispetto a un set di dati più ampio, utilizzando il ML.

    Trasferimento dati verso l’interno
  • Attorno al perimetro
  • Trasferimento dati attorno al perimetro

    Integra perfettamente data lake, data warehouse e Datastore dedicati. 

    Esempio: i dati del catalogo prodotti archiviati nel database potrebbero essere copiati nel servizio di ricerca per semplificare la ricerca nel catalogo prodotti, evitando di eseguire query di ricerca dal database.

    Trasferimento dati verso l’interno
  • Peso dei dati
  • Peso dei dati

    Se i dati nei data lake e negli archivi dedicati continuano a crescere, diventa più difficile spostare questi dati a causa del loro peso. È ugualmente importante assicurare che i dati possano essere facilmente trasferiti dove è necessario, con i giusti comandi, per consentire analisi e ottenere informazioni dettagliate.

    Peso dei dati

Pilastri dell’approccio lake house

Le organizzazioni trasferiscono i dati da diversi silos e li raggruppano in una sola posizione per eseguire analisi dei dati e machine learning su quei dati. Per ricavarne il valore massimo, è necessario sfruttare un approccio lake house che permetta di trasferire facilmente i dati dai data lake ai Datastore dedicati. Questo metodo di progettazione moderno richiede:

Più clienti costruiscono lake house su AWS piuttosto che altrove

  • lake_house_customers_logo_bmw
  • lake_house_customers_logo_nielsen
  • lake_house_customers_logo_engie
  • BMW Group
  • BMW Group
    BMW Group

    Per accelerare l’innovazione e democratizzare l’utilizzo dei dati su vasta scala, BMW Group ha effettuato la migrazione del suo data lake On-Premise verso uno con tecnologia Amazon S3; BMW Group ora elabora TB di dati di telemetria provenienti da milioni di veicoli e risolve i problemi prima che coinvolgano i clienti.

    Leggi il caso di studio 
  • Nielsen
  • Nielsen
    Nielsen

    Nielsen, un’azienda globale di analisi e misurazione dei dati, ha aumentato esponenzialmente la quantità di dati importati, elaborati e riportati ai clienti ogni giorno, sfruttando il vantaggio di una tecnologia cloud moderna. È passata dal misurare 40.000 abitazioni al giorno a più di 30 milioni.

    Leggi il caso di studio 
  • Engie
  • Engie
    lake_house_customers_logo_engie

    ENGIE è uno dei due principali produttori di energia in Francia e conta 160.000 dipendenti e 40 unità operative in 70 paesi. Il loro data lake Common Data Hub di circa 100 TB utilizza i servizi AWS per soddisfare le esigenze aziendali in materia di Data Science, marketing e operazioni.

    Leggi il caso di studio 

Partner

Scopri come i nostri Partner aiutano le organizzazioni a costruire un’architettura dati moderna sfruttando l’approccio lake house su AWS.

Cloudera

Cloudera

L'esecuzione di Cloudera Enterprise su AWS offre a utenti IT e aziendali una piattaforma di gestione dei dati che può fungere da fondamento per l'elaborazione e l'analisi dei dati moderni.

Ulteriori informazioni »

Informatica Cloud

Informatica Cloud

Informatica Cloud fornisce un'integrazione ottimizzata per i servizi di dati di AWS con connettività nativa a oltre 100 applicazioni.

Ulteriori informazioni »

Dataguise

Dataguise

Dataguise è il leader nell'esecuzione aziendale sicura, fornendo soluzioni di sicurezza incentrate sui dati per rilevare e proteggere i dati sensibili di un'impresa, indipendentemente dal luogo e da chi necessita di sfruttarli.

Ulteriori informazioni »

Orchestrazione dei dati Alluxio

Orchestrazione dei dati Alluxio

L'orchestrazione dei dati Alluxio permette ai clienti di sfruttare al meglio i servizi AWS chiave, come EMR e S3 per carichi di lavoro di analisi e IA - Intelligenza Artificiale.

Ulteriori informazioni »

Nozioni di base

Programma AWS Data Driven Everything

AWS Data-Driven Everything
Nel programma AWS Data-Driven EVERYTHING (D2E), AWS collaborerà con i nostri clienti per muoversi più velocemente, con maggiore precisione e una portata molto più ambiziosa per far partire il proprio volàno di dati.

Ulteriori informazioni »

AWS Data Lab

AWS Data Lab
AWS Data Lab offre l'impegno congiunto e accelerato tra clienti e risorse tecniche AWS, consentendo di generare risultati tangibili che accelerano le iniziative di modernizzazione di dati e analisi.

Ulteriori informazioni »

Architettura di riferimento di analisi e Big Data di AWS

Architettura di riferimento di analisi e Big Data di AWS
Apprendi le best practice dell'architettura per l'analisi dei dati nel cloud, il data warehousing e la gestione dei dati su AWS.

Ulteriori informazioni »