Data lake su AWS
Sviluppa, testa e distribuisci rapidamente il tuo data lake con AWS e le soluzioni dei partner.
Panoramica
I tradizionali strumenti di archiviazione di dati e di analisi non riescono più a offrire l’agilità e la flessibilità necessarie per fornire approfondimenti aziendali pertinenti. È proprio per questo che molte organizzazioni stanno passando all’architettura data lake. Con i Quick Start per i data lake e le soluzioni pronte per i clienti, AWS e i partner con competenza semplificano e velocizzano lo sviluppo dei data lake. Un data lake è un approccio architetturale che consente di archiviare enormi quantità di dati in una posizione centrale affinché siano immediatamente disponibili per la classificazione, l’elaborazione, l’analisi e il consumo da parte di diversi gruppi all’interno di un’organizzazione. I dati possono essere archiviati così come sono, pertanto non è necessario convertirli in uno schema predefinito, né sapere in anticipo quali domande porvi.
Un data lake su AWS può essere utile per:
-
Raccogliere e archiviare dati di qualsiasi tipo, su qualunque scala e a basso costo.
-
Proteggere i dati e prevenire gli accessi non autorizzati.
-
Catalogare, cercare e trovare i dati pertinenti nel repository centrale.
-
Eseguire nuovi tipi di analisi dati in modo rapido e facile.
-
Utilizzare un’ampia gamma di motori analitici per analisi ad hoc, streaming in tempo reale, analisi predittive, IA e machine learning.
Un data lake può inoltre integrare e ampliare un data warehouse esistente. Se stai già utilizzando un data warehouse o desideri implementarne uno, puoi usare un data lake come origine per dati sia strutturati che non strutturati.
Creare un data lake su AWS
Vantaggi di un data lake su AWS
-
Acquisisci facilmente i dati in vari modi, anche grazie all’utilizzo di Amazon Kinesis, AWS Import/Export Snowball, AWS Direct Connect e altri strumenti. Archivia tutti i dati, indipendentemente dal volume o dal formato, utilizzando Amazon Simple Storage Service (Amazon S3).
-
Implementa l’infrastruttura di cui hai bisogno quasi istantaneamente. In questo modo, i team potranno essere più produttivi, sarà più semplice sperimentare e i progetti potranno essere rilasciati più rapidamente.
-
AWS offre funzionalità in tutti i processi a livello di strutture, rete, software e azienda per soddisfare i requisiti più esigenti. Gli ambienti sono sottoposti a verifiche continue per mantenere la conformità a certificazioni quali ISO 27001, FedRAMP, DoD SRG e PCI DSS.
-
Crea praticamente qualsiasi applicazione di big data e supporta qualsiasi carico di lavoro indipendentemente dal volume, dalla velocità e dalla varietà di dati. AWS offre più di cinquanta servizi e aggiunge migliaia di funzionalità ogni anno, garantendo tutto ciò che occorre per raccogliere, archiviare, elaborare, analizzare e consultare i big data nel cloud.
Scarica l’eBook
Scopri come AWS e i partner con competenza della rete dei partner AWS (APN) hanno aiutato le organizzazioni a eseguire la migrazione di enormi volumi di dati eterogenei a un data lake su AWS, dove possono utilizzarli in modo rapido e semplice per ottenere approfondimenti pratici di estrema importanza.
Partner tecnologici APN in evidenza
Attunity
Fanatics, un famoso sito web di abbigliamento e merchandising sportivo per tifosi, aveva bisogno di acquisire terabyte di dati da più origini storiche e in streaming (sistemi transazionali, e-commerce e back-office) in un data lake su Amazon S3. Una volta acquisiti, i dati dovevano essere analizzati per identificare, prevedere e soddisfare meglio le esigenze dei clienti legate ai prodotti offerti da Fanatics in più di trecento negozi online e offline.
Per portare a termine questa operazione, Fanatics ha scelto Attunity Replicate, una soluzione software dotata di acquisizione dei dati continua (CDC) e threading parallelo per lo streaming di dati in tempo reale da più origini in un data lake su Amazon S3. I dati possono essere quindi utilizzati in Apache Kafka per analisi in tempo reale. Attunity aiuta Fanatics a evitare l’onere operativo di dover estrarre manualmente i dati da origini diverse e consente all’organizzazione di vedere i risultati in tempo reale.
Titolo del webinar: Fanatics importa dati in streaming in un data lake su AWS
Relatore del cliente: Alan Chang, Senior Product Manager presso Fanatics
Relatore di Attunity: Jordan Martz, Director of Technology
Relatore di AWS: Paul Sears, Solutions Architect
Databricks
L’esecuzione di carichi di lavoro di data science su dati provenienti da diverse origini, come data lake, data warehouse, streaming e molte altre, presenta sfide per le organizzazioni che hanno bisogno di utilizzare i propri dati per favorire miglioramenti operativi e dei prodotti. La casa editrice di libri di testo McGraw-Hill aveva bisogno di rimuovere questi silo di dati al fine di trasformare il proprio modello di business per soddisfare una crescente attenzione per l’apprendimento digitale. In particolare, l’azienda desiderava avere la capacità di eseguire rapidamente operazioni di analisi complesse e favorire la collaborazione tra analisti aziendali, ingegneri dei dati e data scientist.
McGraw-Hill ha distribuito Databricks, una piattaforma di analisi unificata che consente di lavorare in modo efficiente con dati sia in streaming che storici archiviati in data lake su Amazon S3 e in più data warehouse. In questo webinar, scoprirai come Databricks, sviluppata dai creatori originali di Apache Spark™, consente a McGraw-Hill di analizzare i dati in streaming e storici su una scala e a una velocità che la soluzione precedente semplicemente non poteva fornire. Carichi di lavoro di data science che prima richiedevano settimane ora vengono eseguiti in poche ore.
Titolo del webinar: McGraw-Hill ottimizza i carichi di lavoro di analisi con Databricks
Relatore del cliente: Matthew Ashbourne, Lead Software Engineer presso McGraw-Hill Education
Relatore di Databricks: Brian Dirking, Senior Director of Partner Marketing
Relatore di AWS: Pratap Ramamurthy, Partner Solutions Architect
Qubole
Le tecnologie di big data possono essere sia complesse, sia comportare processi manuali che richiedono tempo. Le organizzazioni che automatizzano in modo intelligente le operazioni legate ai big data riducono i costi, rendono i propri team più produttivi, scalano in modo più efficiente e diminuiscono il rischio di errori.
Nel nostro webinar, alcuni rappresentanti di TiVo, un’azienda che ha creato una piattaforma di registrazione digitale per contenuti televisivi, spiegheranno come hanno implementato una nuova piattaforma di big data e analisi che scala in risposta all’evoluzione della domanda. Scoprirai come la soluzione consente a TiVo di orchestrare facilmente cluster di big data utilizzando Amazon Elastic Cloud Compute (Amazon EC2) e istanze spot Amazon EC2 che leggono i dati da un data lake su Amazon Simple Storage Service (Amazon S3); vedrai inoltre come questo sistema riduce i costi e il lavoro di sviluppo necessari per supportare gli utenti di rete e pubblicitari. TiVo condividerà le lezioni apprese e le best practice per acquisire, elaborare e rendere disponibili per l’analisi in modo rapido e conveniente terabyte di dati di streaming e visualizzazione in batch di milioni di famiglie.
Titolo del webinar: TiVo: come scalare i nuovi prodotti con un data lake su AWS e Qubole
Relatore del cliente: Ashish Mrig, Senior Manager, Big Data Analytics presso TiVo
Relatore di Qubole: Harsh Jetly, Solutions Architect
Relatore di AWS: Paul Sears, Solutions Architect
Talend
Scopri come ridurre i tempi di sviluppo e innovare su AWS. In questo webinar, Beachbody, azienda fornitrice di video di allenamenti per fitness, perdita di peso e sviluppo muscolare da svolgere a casa, parla della propria esperienza di migrazione a un’architettura data lake su AWS utilizzando Talend. Beachbody racconterà come ha creato una piattaforma aperta di dati aziendali che offre ai dipendenti l’accesso a dati sicuri e ben gestiti e aumenta l’efficienza DevOps in tutta l’azienda.
Partecipa al nostro webinar e scopri come Talend e AWS hanno aiutato Beachbody a eseguire la migrazione di una vasta gamma di origini dati strutturate e non strutturate a un data lake, a ridurre i cicli di sviluppo e test e a superare complesse sfide di distribuzione comuni ai dati in tempo reale.
Titolo del webinar: Progettare un data lake aperto aziendale
Relatore di Talend: Ashwin Viswanath, Director, Cloud Product Marketing
Relatore del cliente: Eric Anderson, Executive Director, Data presso Beachbody
Relatore di AWS: Pratap Ramamurthy, Solutions Architect
Informatica
La soluzione Intelligent Data Lake Management di Informatica consente di acquisire, pulire, elaborare, gestire e proteggere elevati volumi di dati grezzi in un data lake affidabile su AWS. Le funzionalità di IA e catalogazione aziendale basate sui metadati consentono agli stakeholder aziendali, come gli analisti, di individuare, profilare, preparare e proteggere rapidamente i dati per ottenere approfondimenti aziendali tempestivi e pertinenti. In sintesi, Informatica consente alle aziende di utilizzare il potere di un data lake su AWS e ottenere approfondimenti pratici basati su big data che favoriscono l’innovazione e le vendite.
Looker
Le aziende di oggi operano con i big data e, affinché possano apportare un vero vantaggio, i parametri generati a partire da tali dati devono essere definiti centralmente e completamente accessibili. Oggi la soluzione è Looker, una piattaforma di dati moderna che consente a tutti i dipendenti dell’azienda di trovare ed esplorare i dati necessari per prendere decisioni. Looker è progettato per piattaforme cloud come Amazon Web Services (AWS) e consente di eseguire query direttamente in moderni database cloud come i data lake. I clienti utilizzano Looker sia per analisi interne, sia per rendere visibili i dati a clienti, partner e fornitori.
Partner di consulenza APN in evidenza
Semplifica la distribuzione di un data lake basato sul cloud con AWS e Talend.
Rilassati grazie al processo in tre fasi di Cloudwick collaudato per la progettazione e la gestione dei data lake su AWS.
Affidati all’esperienza di NorthBay e al suo solido allineamento con AWS per sviluppare una soluzione di data lake personalizzata.