La condivisione di dati in Amazon Redshift permette di ottenere maggiori prestazioni, facilità d'utilizzo e vantaggi economici che Amazon Redshift offre in un singolo cluster per implementazioni a cluster multipli permettendo al contempo la condivisione di dati. La condivisione di dati consente l'accesso istantaneo, granulare e rapido ai dati tra i cluster Amazon Redshift senza il bisogno di copiarli o spostarli. La condivisione di dati fornisce accesso in diretta ai dati permettendo agli utenti la visualizzazione di informazioni sempre aggiornate e coerenti, grazie all'aggiornamento delle stesse nel data warehouse. È possibile condividere dati in diretta in modo sicuro con i cluster Amazon Redshift negli stessi account AWS o in account diversi e tra più regioni.
La condivisione di dati di Amazon Redshift fornisce:
- Un modo semplice e diretto di condividere i dati tra i data warehouse di Amazon Redshift
- Accesso granulare, a prestazioni elevate e istantaneo senza copie o spostamento di dati.
- Visualizzazioni in diretta e coerenti dal punto di vista transazionale dei dati tra tutti i consumatori.
- Collaborazione governata e sicura all'interno e tra organizzazioni e parti esterne.
Come funziona

Casi d'uso
-
Isolamento e capacità di carico del carico di lavoro
-
Collaborazione tra gruppi
-
Dati e analisi come servizio
-
Agilità nello sviluppo
-
Isolamento e capacità di carico del carico di lavoro
-
Isolamento e capacità di carico del carico di lavoro
I dati condivisi da un cluster ETL con BI isolata e cluster di analisi in un'architettura hub-spoke che fornisce l'isolamento del carico di lavoro in lettura e chargeback facoltativo per i costi. Ogni cluster di analisi può essere dimensionato secondo i requisiti di prestazione relativamente ai prezzi e nuovi carichi di lavoro possono essere avviati in modo semplice.
-
Collaborazione tra gruppi
-
Collaborazione tra gruppi
Condivisione di dati tra più gruppi aziendali in modo che ognuno mantenga i cluster Amazon Redshift separati per consentire la collaborazione per analisi e data science più estese. Ogni cluster Amazon Redshift può essere produttore di alcuni dati e al contempo consumatore di altri set di dati.
-
Dati e analisi come servizio
-
Dati e analisi come servizio
Condivisione di dati come servizio tra diversi gruppi nell’ambito dell’organizzazione e con terze parti esterne.
-
Agilità nello sviluppo
-
Agilità nello sviluppo
Condivisione di file tra ambienti di sviluppo, test e produzione, a qualsiasi livello di granularità senza la necessità di acquisire snapshot ed eseguire ripristini completi.
Storie di successo dei clienti

FactSet
"Molti clienti FactSet stanno adottando programmi di trasformazione del cloud e di modernizzazione della tecnologia, sforzandosi di ridurre i costi, consolidare infrastrutture e fornitori ed eliminare i dati duplicati. Per soddisfare le necessità in evoluzione dei nostri clienti, FactSet fornisce soluzioni flessibili che possono essere integrate senza interruzioni in numerosi ambienti di flusso di lavoro preferiti, incluso AWS Redshift, rendendo l'adozione e l'implementazione dei nostri contenuti e delle nostre soluzioni pronte all'uso. Sfruttando le funzionalità di condivisione di dati di Redshift, i feed di dati standard di FactSet sono istantaneamente disponibili nel cluster Redshift dei nostri clienti. Ciò permette loro di esternalizzare tutti i processi ETL su FactSet, dando origine a dati ottimizzati, minor tempo di commercializzazione, maggiore integrità dei dati efficienti e un processo semplificato per la scoperta, il collegamento e la verifica dei dati."
Namita Jain, Product Owner – Cloud & Managed Services

Epsilon
"Prima della condivisione di dati, i nostri processi per lo scambio di dati con i nostri clienti tramite Amazon Redshift non sfruttava il massimo della sua efficienza. Solitamente, creavamo due cluster aggiuntivi due volte a settimana, ripristinavamo, scaricavamo, copiavamo e rilasciavamo schemi, e concedevamo privilegi. Con la condivisione di dati, possiamo condividere dati con i nostri clienti riducendo o eliminando i tempi di inattività. Con meno di 10 istruzioni SQL, otteniamo in sicurezza ciò che prima richiedeva un processo molto più lungo. Questa caratteristica ci dà più flessibilità, ci fa risparmiare tempo e risorse e aumenta la soddisfazione del cliente."
Samantha Corkery, Principal Database Administrator - Epsilon

Warner Bros.
"Alla Warner Bros. Games costruiamo e manteniamo infrastrutture di mobilità dei dati complesse per gestire i movimenti dei dati tra singoli cluster di gioco e cluster di funzione aziendale consolidati. Tuttavia, sviluppare e mantenere questo sistema monopolizza risorse preziose del team e provoca ritardi che ci impediscono di agire sui dati con agilità e velocità. Utilizzando la funzionalità di condivisione dei dati di Redshift possiamo rimuovere l'intero sottosistema che abbiamo creato per la copia, lo spostamento e il caricamento dei dati tra i cluster Redshift. Questo permetterà a tutti i team aziendali di prendere decisioni sul set di dati corretto più velocemente e in modo più efficiente. Inoltre, la condivisione dei dati di Redshift ci permetterà anche di riprogettare l'architettura del provisioning di calcolo per allinearci in modo più preciso alle risorse necessarie per eseguire i carichi di lavoro SQL di tal funzioni, consentendo infine un'operatività dell'infrastruttura più semplice.
Kurt Larson, Technical Director - Warner Bros. Analisi

Yelp
"la funzionalità di condivisione dei dati permette a più cluster Redshift di eseguire query su dati situati nei cluster RA3 e il relativo storage gestito. Questo ci permette di evitare ritardi nella messa a disposizione dei dati per i nostri team e riduce il volume di copie di dati e i relativi recuperi. Ora possiamo usare il nostro tempo in modo ancora più efficace utilizzando i dati in Redshift e consentire una migliore collaborazione invece che orchestrare dati".
Steven Moy, Engineer - Yelp

Fannie Mae
"Alla Fannie Mae abbiamo adottato un approccio decentralizzato per la gestione dei data warehouse con decine di cluster Amazon Redshift tra numerose applicazioni. Siccome ogni team gestisce il proprio set di dati, spesso emerge la necessità da parte di un'applicazione di eseguire query su set di dati di altre applicazioni e unire i dati disponibili localmente. Spesso scarichiamo e spostiamo i dati da un cluster all'altro introducendo inevitabilmente ritardi nell'accesso ai dati per i nostri team. Abbiamo affrontato problematiche con il consumo di risorse accentuato dalle operazioni di unload sui cluster dei produttori e la condivisione di dati ci permette di saltare questa operazione intermedia ad Amazon S3, risparmiando tempo e riducendo il consumo. Molte applicazioni eseguono operazioni di unload attualmente per condividere set di dati e stiamo pianificando di convertire tutti i processi di questo tipo per sfruttare la nuova funzionalità di condivisione dei dati. Con la condivisione dei dati possiamo consentire la condivisione senza interruzioni dei dati tra i team di applicazioni e offrire loro le normali visualizzazioni senza ETL. Siamo anche in grado di evitare le copie dei dati tra ambienti di pre produzione, ricerca e produzione per ogni applicazione. La condivisione dei dati ci ha dato maggiore agilità e flessibilità per dimensionare le analisi in ambienti altamente distribuiti come Fannie Mae".
Amy Tseng, Enterprise Databases Manager - Fannie Mae

Home24
"Lo storage condiviso ci ha permesso di concentrarci su cosa importa davvero, rendendo i dati disponibili agli utenti finali. I dati non sono più bloccati in una miriade di medium storage o formati, accessibili solo attraverso API select, ma risiedono in un singolo SQL".
Marco Couperus, Engineering Manager - home24
Risorse
Condivisione dei dati Amazon Redshift in modo sicuro tra i cluster Amazon Redshift per l'isolamento del carico di lavoro
Implementazione di modelli multi-tenant in Amazon Redshift utilizzando la condivisione di dati
Nozioni di base su Amazon Redshift

Segui questi passaggi per caricare i dati del campione e iniziare ad analizzarli con Amazon Redshift.

Ottieni l'accesso immediato al piano gratuito di AWS.