Le partage de données Amazon Redshift vous permet d'étendre la facilité d'utilisation, les performances et les avantages en termes de coûts qu'Amazon Redshift offre dans un seul cluster à des déploiements multi-clusters tout en étant capable de partager des données. Le partage de données permet un accès aux données instantané, précis et rapide dans les clusters Amazon Redshift sans avoir besoin de les copier ou de les déplacer. Le partage de données fournit un accès en direct aux données afin que vos utilisateurs voient toujours les informations les plus récentes et les plus cohérentes au fur et à mesure qu'elles sont mises à jour dans l'entrepôt des données. Vous pouvez partager en toute sécurité des données en direct avec les clusters Amazon Redshift dans le même compte AWS ou dans des comptes différents sur l'ensemble des régions.
Le partage de données Amazon Redshift fournit :
- Un moyen simple et direct de partager des données entre les entrepôts de données Amazon Redshift
- Un accès instantané, précis et haute performance sans copie ni déplacement de données.
- Des vues en direct et transactionnellement cohérentes des données pour tous les consommateurs.
- Collaboration sécurisée et régie au sein et entre les organisations et les parties externes.
Principe de fonctionnement

Cas d'utilisation
-
Isolation de la charge de travail et facturation
-
Collaboration entre groupes
-
Données et analytique en tant que service
-
Agilité du développement
-
Isolation de la charge de travail et facturation
-
Isolation de la charge de travail et facturation
Partagez les données d'un cluster ETL avec plusieurs clusters BI et analytiques isolés dans une architecture hub-spoke afin de fournir une isolation de la charge de travail en lecture et une refacturation optionnelle des frais. Chaque cluster analytique peut être dimensionné en fonction de ses besoins en termes de prix/performances et de nouvelles charges de travail peuvent être intégrées facilement.
-
Collaboration entre groupes
-
Collaboration entre groupes
Partage des données entre plusieurs groupes d'entreprises qui maintiennent chacun des clusters Amazon Redshift séparés afin de collaborer pour une analytique et une science des données plus larges. Chaque cluster Amazon Redshift peut être producteur de certaines données, mais peut aussi être consommateur d'autres jeux de données.
-
Données et analytique en tant que service
-
Données et analytique en tant que service
Partage de données en tant que service entre différents groupes de l'organisation et également avec des parties externes en dehors des limites de l'organisation.
-
Agilité du développement
-
Agilité du développement
Partage de données entre les environnements de développement, de test et de production, à n'importe quelle granularité sans avoir à prendre des instantanés et à les restaurer entièrement.
Témoignages de réussite

FactSet
« De nombreux clients FactSet entreprennent des programmes de transformation du cloud et de modernisation des technologies dans le but de réduire les coûts, de consolider leurs infrastructures et leurs fournisseurs, et d'éliminer les données dupliquées. Afin de répondre aux besoins évolutifs de nos clients, FactSet fournit des solutions flexibles qui peuvent être intégrées de manière transparente dans un certain nombre d'environnements de flux de travail préférés, notamment AWS Redshift, ce qui aboutit à l'adoption et à la mise en œuvre clés en main de nos contenus et de nos solutions. En exploitant les capacités de partage de données de Redshift, les flux de données standard de FactSet sont instantanément disponibles dans le cluster Redshift de nos clients. Cela leur permet d'externaliser tous les processus ETL vers FactSet, ce qui se traduit par une rationalisation des données, une réduction des délais de commercialisation, une intégrité des données plus efficace et un processus simplifié en matière de découverte, de liaison et de test des données. »
Namita Jain, propriétaire du produit – Cloud & Managed Services

Epsilon
« Avant le partage de données, notre processus d'échange de données avec nos clients à l'aide d'Amazon Redshift n'était pas aussi efficace qu'il aurait pu l'être. Nous devions généralement faire tourner deux clusters supplémentaires deux fois par semaine, puis restaurer, décharger, copier, supprimer des schémas et accorder des privilèges. Grâce au partage des données, nous pouvons partager des données avec nos clients sans aucun temps d'arrêt. Avec moins de 10 instructions SQL, nous effectuons en toute sécurité ce qui était auparavant un processus beaucoup plus long. Cette fonction nous donne plus de flexibilité, nous fait gagner du temps et de l'argent, et augmente la satisfaction du client. »
Samantha Corkery, administrateur principal de bases de données – Epsilon

Warner Bros.
« Chez Warner Bros. Jeux, nous créons et maintenons des infrastructures complexes de mobilité des données pour gérer les déplacements de données entre les clusters d'un seul jeu et les clusters de fonctions commerciales consolidées. Cependant, le développement et la maintenance de ce système monopolisent de précieuses ressources d'équipe et introduisent des retards qui entravent notre capacité à agir sur les données avec agilité et rapidité. Grâce à la fonction de partage de données de Redshift, nous pouvons supprimer tout le sous-système que nous avons créé pour la copie, le déplacement et le chargement des données entre les clusters Redshift. Cela permettra à toutes nos équipes commerciales de prendre des décisions sur les bons jeux de données plus rapidement et plus efficacement. De plus, le partage de données Redshift nous permettra également de ré-architecturer le provisionnement des calculs afin de mieux s'aligner sur les ressources nécessaires à l'exécution des charges de travail SQL de ces fonctions, permettant ainsi des opérations d'infrastructure plus simples. »
Kurt Larson, directeur technique - Warner Bros. Analytique

Yelp
« La fonction de partage de données permet en toute transparence à plusieurs clusters Redshift d'interroger les données situées dans nos clusters RA3 et leur stockage géré. Cela élimine nos préoccupations concernant les délais de mise à disposition des données pour nos équipes et réduit la quantité de données dupliquées et les soucis de remplissage associés. Nous pouvons maintenant consacrer encore plus de temps à l'utilisation de nos données dans Redshift et permettre une meilleure collaboration au lieu de l'orchestration des données. »
Steven Moy, ingénieur - Yelp

Fannie Mae
« Chez Fannie Mae, nous avons adopté une approche décentralisée de la gestion des entrepôts de données avec des dizaines de clusters Amazon Redshift répartis sur de nombreuses applications. Bien que chaque équipe gère son propre jeu de données, nous avons souvent des cas d'utilisation où une application a besoin d'interroger les jeux de données d'autres applications et d'effectuer des jointures avec les données disponibles localement. Nous déchargeons et déplaçons actuellement les données d'un cluster à un autre, ce qui entraîne des retards dans la fourniture d'un accès rapide aux données à nos équipes. Nous avons eu des problèmes avec les opérations de déchargement qui ont provoqué des pics de consommation de ressources sur les clusters producteurs, et le partage de données nous permet de sauter ce déchargement intermédiaire vers Amazon S3, ce qui permet de gagner du temps et de réduire la consommation. De nombreuses applications effectuent actuellement des déchargements afin de partager des jeux de données et nous avons l'intention de convertir tous ces processus en utilisant la nouvelle fonctionnalité de partage de données. Avec le partage de données, nous pouvons permettre un partage transparent des données entre les équipes d'application et leur donner des vues communes des données sans avoir à faire d'ETL. Nous sommes également en mesure d'éviter les copies de données entre les environnements de pré-production, de recherche et de production pour chaque application. Le partage de données nous a rendu plus agiles et nous a donné la flexibilité nécessaire pour mettre à l'échelle l'analytique dans des environnements hautement distribués comme celui de Fannie Mae. »
Amy Tseng, responsable des bases de données d'entreprise - Fannie Mae

Home24
« Le stockage partagé nous a permis de nous concentrer sur ce qui compte : mettre les données à la disposition des utilisateurs finaux. Les données ne sont plus bloquées dans une myriade de supports de stockage ou de formats, ou accessibles uniquement par le biais de quelques API, mais plutôt avec une même variété de SQL. »
Marco Couperus, responsable de l'ingénierie - home24
Ressources
Partager les données Amazon Redshift en toute sécurité entre les clusters Amazon Redshift pour isoler les charges de travail
Implémentation de modèles multi-tenant dans Amazon Redshift à l'aide du partage de données
Démarrer avec Amazon Redshift

Suivez ces étapes pour charger un exemple de données et commencer à les analyser avec Amazon Redshift.