Architettura moderna dei dati su AWS

Integra perfettamente data lake, data warehouse e gli archivi di dati dedicati

Architettura moderna dei dati: come funziona

Un'architettura moderna dei dati riconosce l'idea che un approccio unico all'analisi dei dati, alla fine, porta a dei compromessi. Non si tratta solo di integrare un data lake con un data warehouse, ma piuttosto di integrare un data lake, un data warehouse e degli archivi dedicati, assicurando una governance unificata e semplicità nel trasferimento dati. Con una moderna architettura di dati su AWS, i clienti possono costruire rapidamente laghi di dati scalabili, utilizzare un'ampia e profonda collezione di servizi di dati costruiti appositamente, garantire la conformità attraverso un accesso unificato ai dati, la sicurezza e la governance, scalare i loro sistemi a basso costo senza compromettere le prestazioni, e condividere facilmente i dati attraverso i confini organizzativi, permettendo loro di prendere decisioni con velocità e agilità su scala.

Architettura moderna dei dati - Come funziona

Perché hai bisogno di un'architettura moderna dei dati

I volumi dei dati stanno aumentando a ritmi senza precedenti, passando dai terabyte ai petabyte e a volte agli exabyte. Gli approcci tradizionali dell’analisi dei dati on-premise non sono in grado di gestire questi volumi di dati perché non assicurano una scalabilità ottimale e sono costosi. Molte aziende trasferiscono i dati da silos diversi e li raggruppano in una sola posizione, spesso definita data lake, per eseguire analisi dei dati e ML direttamente su quei dati. In altri casi, queste stesse aziende archiviano altri dati in Datastore dedicati per effettuare analisi e ottenere velocemente delle informazioni dettagliate da dati strutturati e non strutturati. Questo trasferimento dati può avvenire verso l'esterno, verso l'interno o attorno al perimetro o in condivisione perché i dati hanno un peso.

  • Verso l'esterno
  • Trasferimento dati verso l’esterno

    I clienti archiviano i dati in un data lake e poi trasferiscono una parte di quei dati in un Datastore dedicato per eseguire ulteriori machine learning o analisi dei dati.

    Esempio: i dati clickstream dalle applicazioni Web possono essere raccolti direttamente in un data lake e una parte di quei dati può essere trasferita in un data warehouse per il report giornaliero. Questo concetto è considerato un trasferimento verso l’esterno.

    Trasferimento dati verso l’esterno
  • Verso l’interno
  • Trasferimento dati verso l’interno

    I clienti archiviano i dati in Datastore dedicati come un data warehouse o un database e li trasferiscono in un data lake per eseguire delle analisi su quei dati. 

    Esempio: i risultati di una query per la vendita di prodotti in una Regione specifica vengono copiati dal data warehouse nel data lake per eseguire algoritmi di suggerimento prodotti rispetto a un set di dati più ampio, utilizzando il ML.

    Trasferimento dati verso l’interno
  • Attorno al perimetro
  • Trasferimento dati attorno al perimetro

    Integra perfettamente data lake, data warehouse e Datastore dedicati. 

    Esempio: i dati del catalogo prodotti archiviati nel database potrebbero essere copiati nel servizio di ricerca per semplificare la ricerca nel catalogo prodotti, evitando di eseguire query di ricerca dal database.

    Trasferimento dati verso l'interno
  • In condivisione
  • Trasferimento dati attraverso condivisione

    I clienti utilizzano una moderna architettura dei dati per facilitare la governance e la condivisione dei dati attraverso i confini logici o fisici della governance per creare domini di dati allineati alle linee di business

    Trasferimento dati attraverso condivisione
  • Peso dei dati
  • Peso dei dati

    Se i dati nei data lake e negli archivi dedicati continuano a crescere, diventa più difficile spostare questi dati a causa del loro peso. È ugualmente importante assicurare che i dati possano essere facilmente trasferiti dove è necessario, con i giusti comandi, per consentire analisi e ottenere informazioni dettagliate.

    Peso dei dati

I pilastri di un'architettura moderna dei dati

Le organizzazioni trasferiscono i dati da diversi silos e li aggregano in una sola posizione per eseguire analisi dei dati e machine learning su quei dati. Per ricavarne il valore massimo, è necessario sfruttare un'architettura moderna dei dati che permetta loro di spostare facilmente i dati tra data lake e archivi di dati dedicati. Questo metodo di progettazione moderno richiede:

Più clienti che sfruttano architetture moderne dei dati su AWS piuttosto che altrove

  • BMW Group
  • BMW Group
    BMW Group

    Per accelerare l’innovazione e democratizzare l’utilizzo dei dati su vasta scala, BMW Group ha effettuato la migrazione del suo data lake On-Premise verso uno con tecnologia Amazon S3; BMW Group ora elabora TB di dati di telemetria provenienti da milioni di veicoli e risolve i problemi prima che coinvolgano i clienti.

    Leggi il caso di studio 
  • Nielsen
  • Nielsen
    Nielsen

    Nielsen, un’azienda globale di analisi e misurazione dei dati, ha aumentato esponenzialmente la quantità di dati importati, elaborati e riportati ai clienti ogni giorno, sfruttando il vantaggio di una tecnologia cloud moderna. È passata dal misurare 40.000 abitazioni al giorno a più di 30 milioni.

    Leggi il caso di studio 
  • Engie
  • Engie

    ENGIE è uno dei due principali produttori di energia in Francia e conta 160.000 dipendenti e 40 unità operative in 70 paesi. Il loro data lake Common Data Hub di circa 100 TB utilizza i servizi AWS per soddisfare le esigenze aziendali in materia di Data Science, marketing e operazioni.

    Leggi il caso di studio 

Partner

Scopri come i nostri Partner aiutano le organizzazioni a costruire un'architettura dati moderna su AWS.

Cloudera

Cloudera

L'esecuzione di Cloudera Enterprise su AWS offre a utenti IT e aziendali una piattaforma di gestione dei dati che può fungere da fondamento per l'elaborazione e l'analisi dei dati moderni.

Ulteriori informazioni »

Informatica Cloud

Informatica Cloud

Informatica Cloud fornisce un'integrazione ottimizzata per i servizi di dati di AWS con connettività nativa a oltre 100 applicazioni.

Ulteriori informazioni »

Dataguise

Dataguise

Dataguise è il leader nell'esecuzione aziendale sicura, fornendo soluzioni di sicurezza incentrate sui dati per rilevare e proteggere i dati sensibili di un'impresa, indipendentemente dal luogo e da chi necessita di sfruttarli.

Ulteriori informazioni »

Orchestrazione dei dati Alluxio

Orchestrazione dei dati Alluxio

L'orchestrazione dei dati Alluxio permette ai clienti di sfruttare al meglio i servizi AWS chiave, come EMR e S3 per carichi di lavoro di analisi e IA - Intelligenza Artificiale.

Ulteriori informazioni »

Nozioni di base

Programma AWS Data Driven Everything

AWS Data-Driven Everything
Nel programma AWS Data-Driven EVERYTHING (D2E), AWS collaborerà con i nostri clienti per muoversi più velocemente, con maggiore precisione e una portata molto più ambiziosa per far partire il proprio volàno di dati.

Ulteriori informazioni »

AWS Data Lab

AWS Data Lab
AWS Data Lab offre l'impegno congiunto e accelerato tra clienti e risorse tecniche AWS, consentendo di generare risultati tangibili che accelerano le iniziative di modernizzazione di dati e analisi.

Ulteriori informazioni »

Architettura di riferimento di analisi dei dati e Big Data di AWS

Architettura di riferimento di analisi dei dati e Big Data di AWS
Apprendi le best practice dell'architettura per l'analisi dei dati nel cloud, il data warehousing e la gestione dei dati su AWS.

Ulteriori informazioni »