Le partage de données Amazon Redshift vous permet d'étendre la facilité d'utilisation, les performances et les avantages en termes de coûts qu'Amazon Redshift offre dans un seul cluster à des déploiements multi-clusters tout en étant capable de partager des données. Le partage de données permet un accès aux données instantané, précis et rapide dans les clusters Amazon Redshift sans avoir besoin de les copier ou de les déplacer. Le partage de données fournit un accès en direct aux données afin que vos utilisateurs voient toujours les informations les plus récentes et les plus cohérentes au fur et à mesure qu'elles sont mises à jour dans l'entrepôt des données. Vous pouvez partager en toute sécurité des données en direct avec les clusters Amazon Redshift dans le même compte AWS ou dans des comptes différents.

Le partage de données Amazon Redshift fournit :

  1. Un moyen simple et direct de partager des données entre les entrepôts de données Amazon Redshift
  2. Un accès instantané, précis et haute performance sans copie ni déplacement de données.
  3. Des vues en direct et transactionnellement cohérentes des données pour tous les consommateurs.
  4. Collaboration sécurisée et régie au sein et entre les organisations et les parties externes.
 
Le partage de données entre comptes Amazon Redshift est désormais disponible à l'échelle mondiale.
 
Il n'existe aucun coût supplémentaire pour utiliser le partage de données dans vos clusters Amazon Redshift.
Flux de travail du partage de données Amazon Redshift (8:53)
Le partage de données s'appuie sur le stockage géré Amazon Redshift RA3, qui découple le stockage et le calcul, permettant à l'un ou l'autre d'évoluer indépendamment. Avec le partage de données, les charges de travail accédant aux données partagées sont isolées les unes des autres. Les requêtes accédant aux données partagées s'exécutent sur le cluster consommateur et lisent directement les données de la couche de stockage géré d'Amazon Redshift sans avoir d'impact sur les performances du cluster producteur. Vous pouvez désormais intégrer rapidement n'importe quel nombre de charges de travail avec des schémas d'accès aux données et des exigences SLA différents, sans vous soucier de la contention des ressources. Les charges de travail qui accèdent à des données partagées peuvent se voir allouer des ressources de calcul flexibles qui répondent aux exigences de prix/performances spécifiques à leur charge de travail et être mises à l'échelle de manière indépendante selon les besoins, en libre-service.

Principe de fonctionnement

Principe de fonctionnement du partage de données Redshift

Cas d'utilisation

  • Isolation de la charge de travail et facturation
  • Collaboration entre groupes
  • Données et analytique en tant que service
  • Agilité du développement
  • Isolation de la charge de travail et facturation
  • Isolation de la charge de travail et facturation

    Partagez les données d'un cluster ETL avec plusieurs clusters BI et analytiques isolés dans une architecture hub-spoke afin de fournir une isolation de la charge de travail en lecture et une refacturation optionnelle des frais. Chaque cluster analytique peut être dimensionné en fonction de ses besoins en termes de prix/performances et de nouvelles charges de travail peuvent être intégrées facilement.

    Isolation de la charge de travail et facturation
  • Collaboration entre groupes
  • Collaboration entre groupes

    Partage des données entre plusieurs groupes d'entreprises qui maintiennent chacun des clusters Amazon Redshift séparés afin de collaborer pour une analytique et une science des données plus larges. Chaque cluster Amazon Redshift peut être producteur de certaines données, mais peut aussi être consommateur d'autres jeux de données.

    Collaboration entre groupes
  • Données et analytique en tant que service
  • Données et analytique en tant que service

    Partage de données en tant que service entre différents groupes de l'organisation et également avec des parties externes en dehors des limites de l'organisation.

    Données et analytique en tant que service
  • Agilité du développement
  • Agilité du développement

    Partage de données entre les environnements de développement, de test et de production, à n'importe quelle granularité sans avoir à prendre des instantanés et à les restaurer entièrement.

    Agilité du développement

Témoignages de réussite

home24

FactSet

« De nombreux clients FactSet entreprennent des programmes de transformation du cloud et de modernisation des technologies dans le but de réduire les coûts, de consolider leurs infrastructures et leurs fournisseurs, et d'éliminer les données dupliquées. Afin de répondre aux besoins évolutifs de nos clients, FactSet fournit des solutions flexibles qui peuvent être intégrées de manière transparente dans un certain nombre d'environnements de flux de travail préférés, notamment AWS Redshift, ce qui aboutit à l'adoption et à la mise en œuvre clés en main de nos contenus et de nos solutions. En exploitant les capacités de partage de données de Redshift, les flux de données standard de FactSet sont instantanément disponibles dans le cluster Redshift de nos clients. Cela leur permet d'externaliser tous les processus ETL vers FactSet, ce qui se traduit par une rationalisation des données, une réduction des délais de commercialisation, une intégrité des données plus efficace et un processus simplifié en matière de découverte, de liaison et de test des données. »

Namita Jain, propriétaire du produit – Cloud & Managed Services

home24

Epsilon

« Avant le partage de données, notre processus d'échange de données avec nos clients à l'aide d'Amazon Redshift n'était pas aussi efficace qu'il aurait pu l'être. Nous devions généralement faire tourner deux clusters supplémentaires deux fois par semaine, puis restaurer, décharger, copier, supprimer des schémas et accorder des privilèges. Grâce au partage des données, nous pouvons partager des données avec nos clients sans aucun temps d'arrêt. Avec moins de 10 instructions SQL, nous effectuons en toute sécurité ce qui était auparavant un processus beaucoup plus long. Cette fonction nous donne plus de flexibilité, nous fait gagner du temps et de l'argent, et augmente la satisfaction du client. »

Samantha Corkery, administrateur principal de bases de données – Epsilon

Warner Bros.

Warner Bros.

« Chez Warner Bros. Jeux, nous créons et maintenons des infrastructures complexes de mobilité des données pour gérer les déplacements de données entre les clusters d'un seul jeu et les clusters de fonctions commerciales consolidées. Cependant, le développement et la maintenance de ce système monopolisent de précieuses ressources d'équipe et introduisent des retards qui entravent notre capacité à agir sur les données avec agilité et rapidité. Grâce à la fonction de partage de données de Redshift, nous pouvons supprimer tout le sous-système que nous avons créé pour la copie, le déplacement et le chargement des données entre les clusters Redshift. Cela permettra à toutes nos équipes commerciales de prendre des décisions sur les bons jeux de données plus rapidement et plus efficacement. De plus, le partage de données Redshift nous permettra également de ré-architecturer le provisionnement des calculs afin de mieux s'aligner sur les ressources nécessaires à l'exécution des charges de travail SQL de ces fonctions, permettant ainsi des opérations d'infrastructure plus simples. »

Kurt Larson, directeur technique - Warner Bros. Analytique

Yelp

Yelp

« La fonction de partage de données permet en toute transparence à plusieurs clusters Redshift d'interroger les données situées dans nos clusters RA3 et leur stockage géré. Cela élimine nos préoccupations concernant les délais de mise à disposition des données pour nos équipes et réduit la quantité de données dupliquées et les soucis de remplissage associés. Nous pouvons maintenant consacrer encore plus de temps à l'utilisation de nos données dans Redshift et permettre une meilleure collaboration au lieu de l'orchestration des données. »

Steven Moy, ingénieur - Yelp

Fannie Mae

Fannie Mae

« Chez Fannie Mae, nous avons adopté une approche décentralisée de la gestion des entrepôts de données avec des dizaines de clusters Amazon Redshift répartis sur de nombreuses applications. Bien que chaque équipe gère son propre jeu de données, nous avons souvent des cas d'utilisation où une application a besoin d'interroger les jeux de données d'autres applications et d'effectuer des jointures avec les données disponibles localement. Nous déchargeons et déplaçons actuellement les données d'un cluster à un autre, ce qui entraîne des retards dans la fourniture d'un accès rapide aux données à nos équipes. Nous avons eu des problèmes avec les opérations de déchargement qui ont provoqué des pics de consommation de ressources sur les clusters producteurs, et le partage de données nous permet de sauter ce déchargement intermédiaire vers Amazon S3, ce qui permet de gagner du temps et de réduire la consommation. De nombreuses applications effectuent actuellement des déchargements afin de partager des jeux de données et nous avons l'intention de convertir tous ces processus en utilisant la nouvelle fonctionnalité de partage de données. Avec le partage de données, nous pouvons permettre un partage transparent des données entre les équipes d'application et leur donner des vues communes des données sans avoir à faire d'ETL. Nous sommes également en mesure d'éviter les copies de données entre les environnements de pré-production, de recherche et de production pour chaque application. Le partage de données nous a rendu plus agiles et nous a donné la flexibilité nécessaire pour mettre à l'échelle l'analytique dans des environnements hautement distribués comme celui de Fannie Mae. »

Amy Tseng, responsable des bases de données d'entreprise - Fannie Mae

home24

Home24

« Le stockage partagé nous a permis de nous concentrer sur ce qui compte : mettre les données à la disposition des utilisateurs finaux. Les données ne sont plus bloquées dans une myriade de supports de stockage ou de formats, ou accessibles uniquement par le biais de quelques API, mais plutôt avec une même variété de SQL. »

Marco Couperus, responsable de l'ingénierie - home24

Ressources

Blog

Partage de données entre comptes pour Amazon Redshift

Blog

Partager les données Amazon Redshift en toute sécurité entre les clusters Amazon Redshift pour isoler les charges de travail

Blog

Implémentation de modèles multi-tenant dans Amazon Redshift à l'aide du partage de données

Vidéo

Partage de données entre comptes d'Amazon Redshift

Vidéo

Cas d'utilisation du partage de données Amazon Redshift

Vidéo

AWS en direct : Partage et isolation de données Amazon Redshift

Vidéo

Modèles multi-tenant du partage de données Amazon Redshift

Démarrer avec Amazon Redshift

Guide de démarrage Amazon Redshift
Consulter le guide de démarrage

Suivez ces étapes pour charger un exemple de données et commencer à les analyser avec Amazon Redshift.

En savoir plus 
Créer gratuitement un compte AWS
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire