Le partage de données Amazon Redshift vous permet d'étendre la facilité d'utilisation, les performances et les avantages en termes de coûts qu'Amazon Redshift offre dans un seul cluster à des déploiements multi-clusters tout en étant capable de partager des données. Le partage de données permet un accès aux données instantané, précis et haute performance dans les clusters Amazon Redshift sans avoir besoin de les copier ou de les déplacer. Le partage de données fournit un accès en direct aux données afin que vos utilisateurs voient toujours les informations les plus récentes et les plus cohérentes au fur et à mesure qu'elles sont mises à jour dans l'entrepôt de données. Il n'existe aucun coût supplémentaire pour utiliser le partage de données dans vos clusters Amazon Redshift.

Le partage de données Amazon Redshift fournit :

  1. Un moyen simple et direct de partager des données entre les entrepôts de données Amazon Redshift
  2. Un accès instantané, précis et haute performance sans copie ni déplacement de données.
  3. Des vues en direct et transactionnellement cohérentes des données pour tous les consommateurs.
  4. Collaboration sécurisée et régie au sein et entre les organisations.
Flux de travail du partage de données Amazon Redshift (8:53)
Le partage de données s'appuie sur le stockage géré Amazon Redshift RA3, qui découple le stockage et le calcul, permettant à l'un ou l'autre d'évoluer indépendamment. Avec le partage de données, les charges de travail accédant aux données partagées sont isolées les unes des autres. Les requêtes accédant aux données partagées s'exécutent sur le cluster consommateur et lisent directement les données de la couche de stockage géré d'Amazon Redshift sans avoir d'impact sur les performances du cluster producteur. Vous pouvez désormais intégrer rapidement n'importe quel nombre de charges de travail avec des schémas d'accès aux données et des exigences SLA différents, sans vous soucier de la contention des ressources. Les charges de travail qui accèdent à des données partagées peuvent se voir allouer des ressources de calcul flexibles qui répondent aux exigences de prix/performances spécifiques à leur charge de travail et être mises à l'échelle de manière indépendante selon les besoins, en libre-service.

Principe de fonctionnement

Principe de fonctionnement du partage de données Redshift

Cas d'utilisation

  • Isolation de la charge de travail et facturation
  • Collaboration entre groupes
  • Données et analytique en tant que service
  • Agilité du développement
  • Isolation de la charge de travail et facturation
  • Isolation de la charge de travail et facturation

    Partagez les données d'un cluster ETL avec plusieurs clusters BI et analytiques isolés dans une architecture hub-spoke afin de fournir une isolation de la charge de travail en lecture et une refacturation optionnelle des frais. Chaque cluster analytique peut être dimensionné en fonction de ses besoins en termes de prix/performances et de nouvelles charges de travail peuvent être intégrées facilement.

    Isolation de la charge de travail et facturation
  • Collaboration entre groupes
  • Collaboration entre groupes

    Partage des données entre plusieurs groupes d'entreprises qui maintiennent chacun des clusters Amazon Redshift séparés afin de collaborer pour une analytique et une science des données plus larges. Chaque cluster Amazon Redshift peut être producteur de certaines données, mais peut aussi être consommateur d'autres jeux de données.

    Collaboration entre groupes
  • Données et analytique en tant que service
  • Données et analytique en tant que service

    Partage de données en tant que service entre différents groupes de l'organisation et également avec des parties externes en dehors des limites de l'organisation.

    Données et analytique en tant que service
  • Agilité du développement
  • Agilité du développement

    Partage de données entre les environnements de développement, de test et de production, à n'importe quelle granularité sans avoir à prendre des instantanés et à les restaurer entièrement.

    Agilité du développement

Témoignages de réussite

Warner Bros.

Warner Bros.

« Chez Warner Bros. Jeux, nous créons et maintenons des infrastructures complexes de mobilité des données pour gérer les déplacements de données entre les clusters d'un seul jeu et les clusters de fonctions commerciales consolidées. Cependant, le développement et la maintenance de ce système monopolisent de précieuses ressources d'équipe et introduisent des retards qui entravent notre capacité à agir sur les données avec agilité et rapidité. Grâce à la fonction de partage de données de Redshift, nous pouvons supprimer tout le sous-système que nous avons créé pour la copie, le déplacement et le chargement des données entre les clusters Redshift. Cela permettra à toutes nos équipes commerciales de prendre des décisions sur les bons jeux de données plus rapidement et plus efficacement. De plus, le partage de données Redshift nous permettra également de ré-architecturer le provisionnement des calculs afin de mieux s'aligner sur les ressources nécessaires à l'exécution des charges de travail SQL de ces fonctions, permettant ainsi des opérations d'infrastructure plus simples. »

Kurt Larson, directeur technique - Warner Bros. Analytique

Yelp

Yelp

« La fonction de partage de données permet en toute transparence à plusieurs clusters Redshift d'interroger les données situées dans nos clusters RA3 et leur stockage géré. Cela élimine nos préoccupations concernant les délais de mise à disposition des données pour nos équipes et réduit la quantité de données dupliquées et les soucis de remplissage associés. Nous pouvons maintenant consacrer encore plus de temps à l'utilisation de nos données dans Redshift et permettre une meilleure collaboration au lieu de l'orchestration des données. »

Steven Moy, ingénieur - Yelp

Fannie Mae

Fannie Mae

« Chez Fannie Mae, nous avons adopté une approche décentralisée de la gestion des entrepôts de données avec des dizaines de clusters Amazon Redshift répartis sur de nombreuses applications. Bien que chaque équipe gère son propre jeu de données, nous avons souvent des cas d'utilisation où une application a besoin d'interroger les jeux de données d'autres applications et d'effectuer des jointures avec les données disponibles localement. Nous déchargeons et déplaçons actuellement les données d'un cluster à un autre, ce qui entraîne des retards dans la fourniture d'un accès rapide aux données à nos équipes. Nous avons eu des problèmes avec les opérations de déchargement qui ont provoqué des pics de consommation de ressources sur les clusters producteurs, et le partage de données nous permet de sauter ce déchargement intermédiaire vers Amazon S3, ce qui permet de gagner du temps et de réduire la consommation. De nombreuses applications effectuent actuellement des déchargements afin de partager des jeux de données et nous avons l'intention de convertir tous ces processus en utilisant la nouvelle fonctionnalité de partage de données. Avec le partage de données, nous pouvons permettre un partage transparent des données entre les équipes d'application et leur donner des vues communes des données sans avoir à faire d'ETL. Nous sommes également en mesure d'éviter les copies de données entre les environnements de pré-production, de recherche et de production pour chaque application. Le partage de données nous a rendu plus agiles et nous a donné la flexibilité nécessaire pour mettre à l'échelle l'analytique dans des environnements hautement distribués comme celui de Fannie Mae. »

Amy Tseng, responsable des bases de données d'entreprise - Fannie Mae

home24

Home24

« Le stockage partagé nous a permis de nous concentrer sur ce qui compte : mettre les données à la disposition des utilisateurs finaux. Les données ne sont plus bloquées dans une myriade de supports de stockage ou de formats, ou accessibles uniquement par le biais de quelques API, mais plutôt avec une même variété de SQL. »

Marco Couperus, responsable de l'ingénierie - home24

Ressources

Blog

Partager les données Amazon Redshift en toute sécurité entre les clusters Amazon Redshift pour isoler les charges de travail

Blog

Implémentation de modèles multi-tenant dans Amazon Redshift à l'aide du partage de données

Vidéo

Cas d'utilisation du partage de données Amazon Redshift

Vidéo

AWS en direct : Partage et isolation de données Amazon Redshift

Vidéo

Modèles multi-tenant du partage de données Amazon Redshift

Démarrer avec Amazon Redshift

Guide de démarrage Amazon Redshift
Consulter le guide de démarrage

Suivez ces étapes pour charger un exemple de données et commencer à les analyser avec Amazon Redshift.

En savoir plus 
Créer gratuitement un compte AWS
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Ateliers Amazon Redshift
Acquérir une expérience pratique avec les laboratoires

Profitez de conseils et apprenez des techniques pour tirer le meilleur parti d'Amazon Redshift.

Démarrer