Cloud AWS
Démarrer avec Amazon Redshift

Les données et les analyses sont indispensables pour les entreprises qui souhaitent rester compétitives. Les entreprises utilisent des rapports, des tableaux de bord et des outils d'analyse pour exploiter leurs données, surveiller leurs performances et soutenir la prise de décision. Ces rapports, tableaux de bord et outils d'analyse sont alimentés par les entrepôts de données, qui stockent les données efficacement pour minimiser le taux d'E/S et fournir des résultats de requêtes ultra rapidement à des centaines de milliers d'utilisateurs en même temps.

Téléchargez le livre blanc : Enterprise Data Warehousing on AWS

Un entrepôt de données fonctionne comme un référentiel central contenant des informations issues d'une ou de plusieurs sources de données. Les données stockées dans un entrepôt de données proviennent de systèmes transactionnels et d'autres bases de données relationnelles, et comprennent généralement des données structurées, semi-structurées et non structurées. Ces données sont traitées, transformées et ingérées à intervalles réguliers. Les utilisateurs, notamment des spécialistes des données, des analystes d'affaires et des décideurs, accèdent aux données traitées dans l'entrepôt de données grâce à des outils d'informatique décisionnelle, des clients SQL et des feuilles de calcul.

 

  Entrepôt de données Base de données transactionnelle
Charges de travail adaptées Analyse, Big Data Traitement des transactions
Types d'opérations Optimisé pour les opérations d'écriture par lots et la lecture d'importants volumes de données pour minimiser le taux d'E/S et maximiser le débit des données Optimisée pour les opérations d'écriture en continu et les volumes importants d'opérations de lecture de petite taille pour maximiser le débit des transactions
Normalisation des données Utilise des schémas dénormalisés tels que les schémas Star et Snowflake Utilise des schémas hautement normalisés, plus adaptés pour répondre aux exigences élevées en matière de débit des transactions
Stockage Nécessite un stockage en colonnes ou un autre stockage spécialisé Bases de données orientées lignes qui stockent des lignes entières dans un bloc physique

AWS vous permet de profiter de tous les avantages clés associés au calcul à la demande, notamment l'accès à des capacités de stockage et de calcul sans limite apparente, et la possibilité de faire évoluer votre système en parallèle avec le volume croissant de données collectées, stockées et interrogées, en payant uniquement les ressources que vous mettez en service. De plus, AWS propose une large gamme de services gérés qui s'intègrent les uns aux autres de façon transparente pour vous permettre de déployer rapidement une solution d'analyse et d'entreposage de données de bout en bout.

L'illustration suivante présente les étapes clés d'une chaîne de processus d'analyse de bout en bout et les services gérés proposés par AWS à chaque étape :

Pipeline d'analyse sur AWS

Amazon Redshift est une solution d'entrepôt de données rapide, conviviale et entièrement gérée. La solution automatise la mise en service des infrastructures et les tâches administratives telles que les sauvegardes, la réplication et l'application de correctifs. Le service s'intègre de façon fluide à des outils d'informatique décisionnelle et ETL tiers. Vous pouvez ainsi obtenir votre premier rapport en seulement quelques minutes. De plus, le volume de données que vous pouvez charger et analyser est illimité. Lorsque vos données évoluent, vous n'avez pas à vous inquiéter à propos de mises à jour onéreuses du système ou de performances lentes. Redshift est rapide à tous les niveaux, car le service utilise un stockage en colonnes et toute une série de techniques d'optimisation. Amazon Redshift est économique et vous payez uniquement en fonction de votre consommation. Un nombre illimité d'utilisateurs peuvent réaliser un nombre illimité d'analyses sur toutes vos données pour seulement 1 000 USD par téraoctet et par an. En savoir plus