Amazon Redshift Lake House Architecture

Interrogez toutes vos données dans des formats de fichier ouverts. Aucun chargement de données requis.

Le volume de données générées par l'IoT, les appareils intelligents, les applications cloud et les réseaux sociaux augmente de façon exponentielle. Vous avez besoin de solutions pour analyser facilement et économiquement toutes ces données en réduisant le temps d'accès aux informations, quel que soit le format ou le lieu de stockage des données.

Amazon Redshift optimise l'architecture Lake House, ce qui vous permet d'interroger les données de votre entrepôt de données, de votre lac de données et des bases de données opérationnelles afin d'obtenir plus rapidement des insights approfondis auxquels vous n'auriez pas accès avec d'autres solutions. Avec une architecture Lake House, vous pouvez stocker les données dans des formats de fichier ouverts dans votre lac de données Amazon S3. Cela vous permet de mettre ces données facilement à la disposition d'autres outils d'analytique et de machine learning au lieu de les enfermer dans un nouveau silo.

Avec Amazon Redshift Lake House Architecture, vous pouvez :

  • Interroger facilement les données dans votre lac de données et les réécrire dans celui-ci dans des formats ouverts.
  • Utiliser des instructions SQL connues pour combiner et traiter les données issues de tous vos magasins de données.
  • Exécuter des requêtes sur les données en direct dans vos bases de données opérationnelles sans avoir besoin de charger des données ni d'utiliser des pipelines ETL.

Discours d'ouverture de re:Invent en 2019 : Amazon Redshift Lake House Architecture (1:23)

Fonctionnalités

Amazon Redshift Lake House Architecture est optimisée par les capacités suivantes :

Amazon Redshift Spectrum

Interrogez les données au format ouvert directement dans le lac de données Amazon S3 sans avoir à charger les données ou à dupliquer votre infrastructure. Avec la fonctionnalité Amazon Redshift Spectrum, vous pouvez interroger des formats de fichier ouverts tels qu'Apache Parquet, ORC, JSON, Avro et CSV. Suivez ce didacticiel étape par étape pour démarrer.

Data Lake Export

Enregistrez les résultats d'une requête Amazon Redshift directement dans votre lac de données S3 dans un format de fichier ouvert (Apache Parquet) à l'aide de la fonctionnalité Data Lake Export. Vous pouvez ensuite analyser ces données avec la fonctionnalité Amazon Redshift Spectrum, ainsi que d'autres services AWS comme SageMaker pour le machine learning et EMR pour les opérations ETL. Regardez cette vidéo de 5 minutes pour commencer.

Requête fédérée

Requête fédérée permet à Amazon Redshift d'interroger les données directement dans les magasins Amazon RDS et Aurora PostgreSQL. Cela vous permet d'intégrer des données opérationnelles opportunes et actualisées dans vos applications de reporting et de BI sans aucune opération ETL. Regardez cette vidéo de 5 minutes ou lisez ce didacticiel pour vous lancer.

Warner Bros
« Nous utilisons de nombreux outils d'analytique tiers et AWS, et nous sommes ravis de voir qu'Amazon Redshift continue à utiliser les mêmes modèles de transformation de données variés que ceux dont nous nous servons avec notre propre solution. Nous utilisons la capacité d'Amazon Redshift qui permet d'interroger des formats de données ouverts dans notre lac de données avec Redshift Spectrum depuis 2017 et maintenant, avec la nouvelle fonction Redshift Data Lake Export, nous pouvons facilement réécrire les données dans notre lac de données. Les performances sont rapides et régulières, y compris pour nos charges de requêtes les plus élevées. Nous sommes impatients d'utiliser la synergie d'une pile de Big Data intégrée afin de renforcer le partage de données entre les clusters Amazon Redshift et d'obtenir davantage de valeur pour un coût inférieur dans le cadre de tous nos jeux. »

Kurt Larson, Directeur technique des opérations de marketing analytique – Warner Bros. Analytique

Ressources

Blog

Modèles de conception ETL et ELT pour l'architecture Lake House à l'aide d'Amazon Redshift : 1re partie

Créez des modèles de conception ETL et ELT évolutifs pour l'architecture Lake House à l'aide d'Amazon Redshift : 1re partie.

Lire le blog »
Tutoriel

Démarrer avec Amazon Redshift Spectrum

Tutoriel étape par étape pour démarrer sur Amazon Redshift Spectrum.

Lancer le tutoriel »
Témoignage client

Mettre à l'échelle l'analytique des données avec Amazon Redshift

Découvrez comment Warner Bros, une entreprise de divertissement, utilise Amazon Redshift pour mettre à l'échelle ses charges de travail d'analytique des données.

Regarder la vidéo »
Créer un compte AWS
Créer un compte AWS

Créez un compte AWS pour accéder instantanément à l'offre gratuite AWS.

Créer un compte 
Offre gratuite d'AWS
Offre gratuite d'AWS

Profitez d'une expérience gratuite et pratique avec la plateforme, les produits et les services AWS.

En savoir plus 
Migrer vos bases de données
Migrer vos bases de données

Migrez vos bases de données rapidement et en toute sécurité avec AWS Database Migration Service.

Découvrir davantage