La condivisione di dati in Amazon Redshift permette di ottenere maggiori prestazioni, facilità d'utilizzo e vantaggi economici che Amazon Redshift offre in un singolo cluster per implementazioni a cluster multipli permettendo al contempo la condivisione di dati. La condivisione di dati consente l'accesso istantaneo, granulare e rapido ai dati tra i cluster Amazon Redshift senza il bisogno di copiarli o spostarli. La condivisione di dati fornisce accesso in diretta ai dati permettendo agli utenti la visualizzazione di informazioni sempre aggiornate e coerenti, grazie all'aggiornamento delle stesse nel data warehouse. È possibile condividere dati in diretta in modo sicuro con i cluster Amazon Redshift negli stessi account AWS o in account diversi e tra più regioni.

La condivisione di dati di Amazon Redshift fornisce:

  1. Un modo semplice e diretto di condividere i dati tra i data warehouse di Amazon Redshift
  2. Accesso granulare, a prestazioni elevate e istantaneo senza copie o spostamento di dati.
  3. Visualizzazioni in diretta e coerenti dal punto di vista transazionale dei dati tra tutti i consumatori.
  4. Collaborazione governata e sicura all'interno e tra organizzazioni e parti esterne.
La condivisione di dati tra account in Amazon Redshift è ora generalmente disponibile.
 
Non sono previsti costi aggiuntivi per l'utilizzo della condivisione di dati sui cluster Amazon Redshift.
Condivisione di dati in Amazon Redshift (1:16)
La condivisione di dati si basa sullo storage gestito RA3 di Amazon Redshift, che disaccoppia storage e calcolo, permettendo a entrambi di dimensionare in modo indipendente. Con la condivisione dei dati i flussi di lavoro che accedono ai dati condivisi vengono isolati gli uni dagli altri. Le query che hanno accesso ai dati condivisi vengono eseguite sul cluster del consumatore e leggono i dati dal livello di storage gestito di Amazon Redshift senza influenzare le prestazioni o il cluster produttore. Ora è possibile acquisire qualsiasi numero di carichi di lavoro con modelli di accesso ai dati e requisiti SLA differenti senza doversi preoccupare di conflitti tra risorse. I carichi di lavoro che accedono ai dati condivisi possono essere alimentati con risorse di calcolo flessibili che rispondono agli specifici requisiti di prestazione relativamente ai prezzi del carico di lavoro e possono essere dimensionati in modo indipendente e autonomo.

Come funziona

Come funziona la condivisione di dati in Redshift

Casi d'uso

  • Isolamento e capacità di carico del carico di lavoro
  • Isolamento e capacità di carico del carico di lavoro

    I dati condivisi da un cluster ETL con BI isolata e cluster di analisi in un'architettura hub-spoke che fornisce l'isolamento del carico di lavoro in lettura e chargeback facoltativo per i costi. Ogni cluster di analisi può essere dimensionato secondo i requisiti di prestazione relativamente ai prezzi e nuovi carichi di lavoro possono essere avviati in modo semplice.

    Isolamento e capacità di carico del carico di lavoro
  • Collaborazione tra gruppi
  • Collaborazione tra gruppi

    Condivisione di dati tra più gruppi aziendali in modo che ognuno mantenga i cluster Amazon Redshift separati per consentire la collaborazione per analisi e data science più estese. Ogni cluster Amazon Redshift può essere produttore di alcuni dati e al contempo consumatore di altri set di dati.

    Collaborazione tra gruppi
  • Dati e analisi come servizio
  • Dati e analisi come servizio

    Condivisione di dati come servizio tra diversi gruppi nell’ambito dell’organizzazione e con terze parti esterne.

    Dati e analisi come servizio
  • Agilità nello sviluppo
  • Agilità nello sviluppo

    Condivisione di file tra ambienti di sviluppo, test e produzione, a qualsiasi livello di granularità senza la necessità di acquisire snapshot ed eseguire ripristini completi.

    Agilità nello sviluppo

Storie di successo dei clienti

home24

FactSet

"Molti clienti FactSet stanno adottando programmi di trasformazione del cloud e di modernizzazione della tecnologia, sforzandosi di ridurre i costi, consolidare infrastrutture e fornitori ed eliminare i dati duplicati. Per soddisfare le necessità in evoluzione dei nostri clienti, FactSet fornisce soluzioni flessibili che possono essere integrate senza interruzioni in numerosi ambienti di flusso di lavoro preferiti, incluso AWS Redshift, rendendo l'adozione e l'implementazione dei nostri contenuti e delle nostre soluzioni pronte all'uso. Sfruttando le funzionalità di condivisione di dati di Redshift, i feed di dati standard di FactSet sono istantaneamente disponibili nel cluster Redshift dei nostri clienti. Ciò permette loro di esternalizzare tutti i processi ETL su FactSet, dando origine a dati ottimizzati, minor tempo di commercializzazione, maggiore integrità dei dati efficienti e un processo semplificato per la scoperta, il collegamento e la verifica dei dati."

Namita Jain, Product Owner – Cloud & Managed Services

home24

Epsilon

"Prima della condivisione di dati, i nostri processi per lo scambio di dati con i nostri clienti tramite Amazon Redshift non sfruttava il massimo della sua efficienza. Solitamente, creavamo due cluster aggiuntivi due volte a settimana, ripristinavamo, scaricavamo, copiavamo e rilasciavamo schemi, e concedevamo privilegi. Con la condivisione di dati, possiamo condividere dati con i nostri clienti riducendo o eliminando i tempi di inattività. Con meno di 10 istruzioni SQL, otteniamo in sicurezza ciò che prima richiedeva un processo molto più lungo. Questa caratteristica ci dà più flessibilità, ci fa risparmiare tempo e risorse e aumenta la soddisfazione del cliente."

Samantha Corkery, Principal Database Administrator - Epsilon

Warner Bros.

Warner Bros.

"Alla Warner Bros. Games costruiamo e manteniamo infrastrutture di mobilità dei dati complesse per gestire i movimenti dei dati tra singoli cluster di gioco e cluster di funzione aziendale consolidati. Tuttavia, sviluppare e mantenere questo sistema monopolizza risorse preziose del team e provoca ritardi che ci impediscono di agire sui dati con agilità e velocità. Utilizzando la funzionalità di condivisione dei dati di Redshift possiamo rimuovere l'intero sottosistema che abbiamo creato per la copia, lo spostamento e il caricamento dei dati tra i cluster Redshift. Questo permetterà a tutti i team aziendali di prendere decisioni sul set di dati corretto più velocemente e in modo più efficiente. Inoltre, la condivisione dei dati di Redshift ci permetterà anche di riprogettare l'architettura del provisioning di calcolo per allinearci in modo più preciso alle risorse necessarie per eseguire i carichi di lavoro SQL di tal funzioni, consentendo infine un'operatività dell'infrastruttura più semplice.

Kurt Larson, Technical Director - Warner Bros. Analisi

Yelp

Yelp

"la funzionalità di condivisione dei dati permette a più cluster Redshift di eseguire query su dati situati nei cluster RA3 e il relativo storage gestito. Questo ci permette di evitare ritardi nella messa a disposizione dei dati per i nostri team e riduce il volume di copie di dati e i relativi recuperi. Ora possiamo usare il nostro tempo in modo ancora più efficace utilizzando i dati in Redshift e consentire una migliore collaborazione invece che orchestrare dati".

Steven Moy, Engineer - Yelp

Fannie Mae

Fannie Mae

"Alla Fannie Mae abbiamo adottato un approccio decentralizzato per la gestione dei data warehouse con decine di cluster Amazon Redshift tra numerose applicazioni. Siccome ogni team gestisce il proprio set di dati, spesso emerge la necessità da parte di un'applicazione di eseguire query su set di dati di altre applicazioni e unire i dati disponibili localmente. Spesso scarichiamo e spostiamo i dati da un cluster all'altro introducendo inevitabilmente ritardi nell'accesso ai dati per i nostri team. Abbiamo affrontato problematiche con il consumo di risorse accentuato dalle operazioni di unload sui cluster dei produttori e la condivisione di dati ci permette di saltare questa operazione intermedia ad Amazon S3, risparmiando tempo e riducendo il consumo. Molte applicazioni eseguono operazioni di unload attualmente per condividere set di dati e stiamo pianificando di convertire tutti i processi di questo tipo per sfruttare la nuova funzionalità di condivisione dei dati. Con la condivisione dei dati possiamo consentire la condivisione senza interruzioni dei dati tra i team di applicazioni e offrire loro le normali visualizzazioni senza ETL. Siamo anche in grado di evitare le copie dei dati tra ambienti di pre produzione, ricerca e produzione per ogni applicazione. La condivisione dei dati ci ha dato maggiore agilità e flessibilità per dimensionare le analisi in ambienti altamente distribuiti come Fannie Mae".

Amy Tseng, Enterprise Databases Manager - Fannie Mae

home24

Home24

"Lo storage condiviso ci ha permesso di concentrarci su cosa importa davvero, rendendo i dati disponibili agli utenti finali. I dati non sono più bloccati in una miriade di medium storage o formati, accessibili solo attraverso API select, ma risiedono in un singolo SQL".

Marco Couperus, Engineering Manager - home24

Risorse

Blog

Condivisione dei dati tra account per Amazon Redshift

Blog

Condivisione dei dati Amazon Redshift in modo sicuro tra i cluster Amazon Redshift per l'isolamento del carico di lavoro

Blog

Implementazione di modelli multi-tenant in Amazon Redshift utilizzando la condivisione di dati

Video

Condivisione dei dati tra account in Amazon Redshift

Video

Casi d'uso della condivisione di dati di Amazon Redshift

Video

AWS on air: condivisione di dati e isolamento in Amazon Redshift

Video

Modelli multi-tenant utilizzando la condivisione di dati in Amazon Redshift

Nozioni di base su Amazon Redshift

Read the documentation
Consulta la Guida alle operazioni di base

Segui questi passaggi per caricare i dati del campione e iniziare ad analizzarli con Amazon Redshift.

Ulteriori informazioni 
Registrati per creare un account gratuito AWS
Registrati per creare un account gratuito

Ottieni l'accesso immediato al piano gratuito di AWS. 

Registrati