AWS Lake Formation

Crea un data lake sicuro in pochi giorni

AWS Lake Formation è un servizio che semplifica la creazione di un data lake sicuro in pochi giorni. Un data lake è un repository curato e sicuro, che memorizza tutti i tuoi dati, sia nel loro formato originale che preparati per l'analisi. Un data lake consente di suddividere i silos di dati e di combinare diversi tipi di analisi per ottenere informazioni dettagliate e guidare le migliori decisioni aziendali.

Tuttavia, la configurazione e la gestione di data lake comporta oggi una serie di attività lunghe, manuali e complicate. Questo lavoro include il caricamento dei dati da diverse origini, il monitoraggio dei flussi di dati, la configurazione delle partizioni, l'attivazione della crittografia e la gestione delle chiavi, la definizione dei processi di trasformazione e il monitoraggio del loro funzionamento, la riorganizzazione dei dati in formato colonnare, la configurazione delle impostazioni di controllo degli accessi, la deduplicazione dei dati ridondanti, la corrispondenza dei record collegati, la concessione dell'accesso ai set di dati e l’audit di accesso nel tempo.

Creare un data lake con Lake Formation è semplice: è sufficiente indicare dove risiedono i tuoi dati e quali policy di accesso ai dati e di sicurezza vuoi applicare. Lake Formation raccoglie e cataloga i dati dai database e dallo storage di oggetti, sposta i dati nel nuovo data lake Amazon S3, pulisce e classifica i dati utilizzando algoritmi di machine learning e assicura l'accesso ai tuoi dati sensibili. I tuoi utenti possono quindi accedere a un catalogo centralizzato di dati che descrive i set di dati disponibili e il loro utilizzo appropriato. Gli utenti possono quindi sfruttare questi set di dati con la loro scelta di servizi di analisi e di machine learning, come Amazon EMR per Apache Spark, Amazon Redshift, Amazon Athena, Amazon Sagemaker e Amazon QuickSight.

AWS re:Invent 2018: Presentazione di AWS Lake Formation

Vantaggi

Crea data lake velocemente

Con Lake Formation puoi spostare, archiviare, catalogare e pulire i dati più rapidamente. Basta semplicemente indirizzare Lake Formation verso le origini dati, dopodiché Lake Formation li analizza e li sposta nel nuovo data lake di Amazon S3. Lake Formation organizza i dati in S3 in base a termini di query utilizzati di frequente e in forma di blocchi dalle dimensioni adatte per aumentare l'efficienza. Lake Formation modifica anche i dati in formati come Apache Parquet e ORC per analisi più rapide. Inoltre, Lake Formation dispone di Machine Learning integrato per deduplicare e trovare record corrispondenti (due voci che si riferiscono alla stessa cosa), in modo da aumentare i dati rapidamente.

Semplifica la gestione della sicurezza

Puoi usare Lake Formation per definire centralmente sicurezza, governance e policy di audit in un unico luogo, invece di effettuare questi compiti per servizio, e quindi puoi applicare queste policy per i tuoi utenti nelle loro applicazioni di analisi. Le tue policy sono implementate costantemente, non è più necessario configurarle manualmente nei servizi di sicurezza (AWS Identity and Access Management e AWS Key Management Service), di storage (S3) e di analisi e Machine Learning (Redshift, Athena e EMR per Apache Spark). In questo modo si riduce lo sforzo di configurare le policy nei servizi e vengono fornite applicazione e conformità coerenti.

Semplifica e rendi sicuro l'accesso self-service ai dati

Con Lake Formation è possibile creare un catalogo dati che descrive i diversi set di dati disponibili e quali gruppi di utenti hanno accesso a ciascuno di essi. In questo modo, gli utenti sono più produttivi, perché trovano più facilmente il set di dati da analizzare. Fornendo un catalogo dati con applicazione della sicurezza coerente, Lake Formation semplifica l'uso del servizio di analisi preferito da parte dei tuoi analisti e data scientist.
Possono utilizzare EMR per Apache Spark, Redshift, Athena, Sagemaker o QuickSight su diversi set di dati ora alloggiati in un singolo data lake. Gli utenti possono anche combinare questi servizi senza dover spostare i dati tra i silos di dati.

Come funziona

AWS Lake Formation, come funziona

Lake Formation aiuta a costruire, rendere sicuro e gestire il data lake. Innanzitutto, identifica i datastore esistenti in S3 o i database relazionali e NoSQL e sposta i dati nel data lake. Quindi trascina, cataloga e prepara i dati per l'analisi. Fornisci ai tuoi utenti un accesso self-service sicuro ai dati mediante il servizio di analisi da loro scelto. Anche altri servizi AWS e applicazioni di terze parti possono accedere ai dati attraverso i servizi mostrati. Lake Formation gestisce tutti i task nella casella arancione ed è integrato dai datastore e dai servizi mostrati nelle caselle blu.

Casi d'uso

Scopri di più su "Che cos'è un data lake?" e i casi d'uso.

Clienti

change-healthcare-red-blue-logo

Change Healthcare è un'azienda indipendente per le tecnologie nel settore sanitario leader nel mercato che fornisce soluzioni basate sui dati e sulle analisi per un totale di circa 2.100 connessioni con enti governativi e commerciali, 5.500 ospedali, 900.000 medici e 33.000 farmacie.

"Gestiamo i dati di milioni di transazioni ogni giorno, sempre in conformità con le normative del settore sanitario, incluso l'HIPAA", ha dichiarato Aaron Symanski, CTO di Change Healthcare. "Siamo ansiosi di lanciare AWS Lake Formation, che offre un punto di controllo centrale per caricare, pulire, proteggere e catalogare facilmente i dati di migliaia di clienti nel nostro data lake basato su AWS, riducendo sensibilmente il nostro carico operativo. I controlli di accesso ai dati di Lake Formation ci aiuteranno a definire le nostre policy e ad applicarle su tutti i servizi di analisi e machine learning che usiamo, con log di audit per mostrare conformità. Inoltre, Lake Formation sarà da subito in conformità con l'HIPAA, soddisfacendo i nostri requisiti di sicurezza e offrendo una soluzione efficace per creare e gestire il nostro data lake."

Fender_digital

Fender Digital fa parte di Fender, il celebre marchio di chitarre, e crea app, siti Web, piattaforme e strumenti apposta per le chitarre, gli amplificatori e gli impianti audio prodotti da Fender.

"I nostri dispositivi e le nostre applicazioni digitali generano una grande quantità di dati utente e di utilizzo. Puntiamo a creare un data lake in AWS che funzioni insieme al nostro data warehouse basato su Amazon Redshift" afferma Joshua Couch, vicepresidente progettazione presso Fender Digital. "Non vedo l’ora che il nostro team cominci a utilizzare AWS Lake Formation. Lake Formation ci aiuterà a caricare, trasformare e catalogare i dati e a renderli disponibili in tutta sicurezza all’interno della nostra organizzazione, su un'ampia varietà di servizi AWS. Con una soluzione pronta per l'uso aziendale come Lake Formation potremo dedicare più tempo ai valori da ricavare dai dati invece che fare il lavoro pesante configurando e gestendo manualmente il nostro data lake."

Product-Page_Standard-Icons_01_Product-Features_SqInk
Ulteriori informazioni sulle caratteristiche di AWS Lake Formation
Ulteriori informazioni 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrati per creare un account
Registrati 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Inizia subito nella console
Accedi