Amazon Redshift est l'entrepôt de données cloud le plus populaire et le plus rapide du marché. Redshift est intégré à votre data lake, il offre des performances jusqu'à trois fois plus élevées que n'importe quel autre entrepôt de données et coûte jusqu'à 75 % moins cher que n'importe quel autre entrepôt de données cloud.

Fonctionnalités et avantages

Nous lançons chaque année des centaines de fonctionnalités et d'améliorations de produits, basées sur les cas d'utilisation et les commentaires client. Apprenez-en davantage sur les nouveautés.

Intégration parfaite avec votre data lake et les services AWS

Amazon Redshift vous permet de traiter rapidement et simplement vos données dans des formats ouverts, et vous connecte facilement à l'écosystème AWS.

Interrogation et exportation de données vers et depuis votre data lake : aucun autre entrepôt de données cloud ne permet d'interroger aussi facilement des données et de réécrire des données dans votre data lake dans des formats ouverts. Vous pouvez interroger des formats de fichiers ouverts tels que Parquet, ORC, JSON, Avro, CSV et plus directement dans S3 à l'aide du langage SQL ANSI courant. Pour exporter des données vers votre data lake, vous utilisez simplement la commande Redshift UNLOAD dans votre code SQL, vous spécifiez Parquet comme format de fichier, et Redshift prend automatiquement en charge le formatage et le transfert des données dans S3. Cela vous donne la possibilité de stocker des données hautement structurées et fréquemment consultées dans un entrepôt de données Redshift, tout en conservant plusieurs exaoctets de données structurées, semi-structurées et non structurées dans S3. La réexportation de données de Redshift vers votre data lake vous permet d'analyser davantage les données avec des services AWS tels qu'Amazon Athena, Amazon EMR et Amazon SageMaker

Requête fédérée (version préliminaire) : grâce à la nouvelle fonctionnalité de requête fédérée de Redshift, vous pouvez accéder à votre base de données opérationnelle et relationnelle. Interrogez des données en temps réel sur une ou plusieurs bases de données Amazon RDS et Aurora PostgreSQL pour obtenir une visibilité instantanée sur les opérations commerciales de bout en bout sans avoir à transférer des données. Vous pouvez combiner des données de votre entrepôt de données Redshift, des données de votre data lake et désormais des données de vos magasins opérationnels pour prendre de meilleures décisions orientées données. Redshift propose des optimisations sophistiquées qui permettent de réduire les données transférées sur le réseau et les complète avec son traitement de données massivement parallèle pour les requêtes hautes performances. En savoir plus.

Écosystème d'analyse AWS : l'intégration native à l'écosystème d'analyse AWS facilite la gestion des flux de travail d'analyse de bout en bout sans friction. Par exemple, AWS Lake Formation est un service qui facilite la configuration d'un data lake sécurisé en quelques jours. AWS Glue peut extraire, transformer et charger (ETL) des données dans Redshift. Amazon Kinesis Data Firehose constitue le moyen le plus facile de capturer, transformer et charger des données de streaming dans Redshift pour une analyse presque en temps réel. Vous pouvez utiliser Amazon EMR pour traiter des données via Hadoop/Spark et charger la sortie dans Amazon Redshift pour l'informatique décisionnelle et les analyses. Amazon QuickSight est le premier service d'informatique décisionnelle avec paiement à l'utilisation que vous pouvez utiliser pour créer des rapports, des visualisations et des tableaux de bord sur des données Redshift. Vous pouvez utiliser Redshift pour préparer vos données à l'exécution de charges de travail de machine learning avec Amazon SageMaker. Pour accélérer les migrations vers Amazon Redshift, vous pouvez utiliser AWS Schema Conversion Tool et AWS Database Migration Service (DMS). Amazon Redshift est également intégré pleinement à Amazon Key Management Service (KMS) et Amazon Cloudwatch à des fins de sécurité, de surveillance et de conformité.

Performances optimales

Amazon Redshift offre des performances de pointe et élevées via une grande flexibilité.

Instances RA3 : les instances RA3 offrent des performances trois fois supérieures à celles de n'importe quel service d'entrepôt de données cloud. Ces instances Amazon Redshift optimisent la vitesse pour les charges de travail gourmandes en performances qui nécessitent d'importantes capacités de calcul, avec la possibilité de payer séparément le calcul, indépendamment du stockage, en spécifiant le nombre d'instances dont vous avez besoin. En savoir plus.

Stockage efficace et traitement des requêtes hautes performances : Amazon Redshift offre des performances de requêtes élevées sur des ensembles de données d'une taille allant de plusieurs gigaoctets à plusieurs exaoctets. Le stockage en colonnes, la compression de données et le mappage de zones réduisent la quantité d'E/S nécessaires à l'exécution des requêtes. Outre les encodages standard tels que LZO et Zstandard, Amazon Redshift offre également un encodage de compression dédié, AZ64, pour les types de données numériques et d'horodatage afin de générer des économies de stockage et d'accroître les performances des requêtes.

Vues matérialisées : les vues matérialisées Amazon Redshift permettent d'accélérer les requête de manière significative pour les charges de travail d'analyse telles que la génération de tableaux de bord, les requêtes des outils d'informatique décisionnelle et les tâches de traitement de données ELT (Extract, Load, Transform). Vous pouvez utiliser des vues matérialisées pour mettre en cache les résultats intermédiaires afin d'accélérer les requêtes qui s'exécutent lentement. Amazon Redshift peut gérer efficacement les vues matérialisées de manière incrémentielle pour continuer à offrir les avantages des performances à faible latence. En savoir plus

Machine learning pour optimiser le débit et les performances : les fonctionnalités de machine learning avancées d'Amazon Redshift offrent des performances et un débit élevés, même avec des charges de travail variables ou une activité utilisateur simultanée. Amazon Redshift utilise des algorithmes sophistiqués pour prévoir et classer les requêtes entrantes en fonction de leurs temps d'exécution et de leurs exigences en matière de ressources, pour gérer de manière dynamique les performances et la simultanéité tout en vous aidant également à hiérarchiser vos charges de travail critiques. L'accélération des requêtes courtes envoie des requêtes courtes d'applications telles que des tableaux de bord vers une file d'attente express pour un traitement immédiat plutôt que d'être en famine derrière des requêtes longues. La gestion automatique des charges de travail utilise le machine learning pour gérer de manière dynamique la mémoire et la simultanéité, ce qui permet d'optimiser le débit des requêtes. En outre, vous pouvez désormais fixer facilement la priorité de vos requêtes les plus importantes, même lorsque des centaines de requêtes sont soumises. Amazon Redshift est également un système d'autoformation qui observe en permanence la charge de travail utilisateur, en déterminant les possibilités d'amélioration des performances à mesure que l'utilisation évolue, en appliquant les optimisations de manière transparente et en formulant des recommandations via Redshift Advisor lorsqu'une action explicite de la part de l'utilisateur est nécessaire pour améliorer encore davantage les performances d'Amazon Redshift. 

Mise en cache des résultats : Amazon Redshift utilise la mise en cache de résultats pour offrir des temps de réaction inférieurs à une seconde pour les requêtes répétées. Les outils de tableau de bord, de visualisation et d'information décisionnelle qui exécutent des requêtes répétées voient leurs performances augmenter significativement. Lorsqu'une requête s'exécute, Amazon Redshift recherche dans le cache un éventuel résultat mis en cache d'une exécution précédente. Si un résultat mis en cache est trouvé et que les données n'ont pas été modifiées, ce résultat est renvoyé immédiatement au lieu d'exécuter à nouveau la requête.

Évolutivité maximale

Que vous mettiez à l'échelle des données ou des utilisateurs, Amazon Redshift est un service quasi illimité. 

Entreposage de données d'une capacité de plusieurs pétaoctets : Amazon Redshift est une solution simple capable d'opérer une mise à l'échelle rapide lorsque vos besoins évoluent. En quelques clics dans la console ou via un simple appel d'API, vous pouvez facilement ajuster le nombre ou le type de nœuds dans votre entrepôt de données, et augmenter ou réduire la charge à mesure que vos besoins en capacités évoluent. Avec le stockage géré, la capacité est automatiquement ajoutée pour prendre en charge des charges de travail allant jusqu'à 8 Po de données compressées. 

Analytique de data lake d'une capacité de plusieurs exaoctets : vous pouvez exécuter des requêtes sur plusieurs pétaoctets de données dans Amazon S3 sans avoir à charger ou transformer des données via la fonctionnalité Redshift Spectrum. Vous pouvez utiliser S3 en tant que data lake hautement disponible, sécurisé et rentable pour stocker des données illimitées dans des formats de données ouverts. Amazon Redshift Spectrum exécute les requêtes sur des milliers de nœuds en parallèle pour fournir des résultats rapides, quelle que soit la complexité de la requête ou la quantité de données.  

Simultanéité illimitée : Amazon Redshift fournit des performances toujours élevées, même en présence de milliers de requêtes simultanées, qu'il s'agisse de requêtes de données issues de votre entrepôt de données Amazon Redshift ou directement de votre data lake Amazon S3. L'adaptation de la simultanéité Amazon Redshift prend en charge un nombre quasi illimité d'utilisateurs et de requêtes simultanés avec des niveaux de service cohérents en ajoutant une capacité transitoire en quelques secondes à mesure que la simultanéité augmente. 

Valeur optimale

L'utilisation d'Amazon Redshift en tant qu'entrepôt de données cloud vous offre la possibilité de payer séparément le calcul et le stockage, des coûts prévisibles via des contrôles, et des options permettant de payer à l'utilisation ou de réaliser jusqu'à 75 % d'économies avec un engagement d'instance réservée.

Options flexibles de tarification : Amazon Redshift est l'entrepôt de données le plus économique et vous disposez de plusieurs options pour optimiser le paiement de votre entrepôt de données. Vous pouvez commencer modestement à seulement 0,25 USD l'heure sans engagement, et passer à seulement 1 000 USD par téraoctet et par an. Amazon Redshift est le seul entrepôt de données cloud qui offre une tarification à la demande sans coûts initiaux, une tarification d'instance réservée pouvant vous faire économiser jusqu'à 75 % en vous engageant pour une durée de 1 à 3 ans, et une tarification par requête basée sur la quantité de données analysées dans votre data lake Amazon S3. La tarification d'Amazon Redshift inclut la sécurité intégrée, la compression des données, le stockage de sauvegarde et le transfert de données. À mesure que la taille des données augmente, vous utilisez le stockage géré dans les instances RA3 pour stocker les données de manière rentable à 0,024 USD par Go et par mois.

Des coûts prévisibles, même avec des charges de travail qui ne le sont pas : Amazon Redshift permet aux clients d'effectuer une mise à l'échelle avec un ratio coût-impact minimal, car chaque cluster gagne jusqu'à une heure de crédits gratuits d'adaptation de la simultanéité par jour. Ces crédits gratuits suffisent pour satisfaire les besoins en termes de simultanéité de 97 % des clients. Cela vous donne une prévisibilité dans vos coûts mensuels, et ce, même pendant les périodes de fluctuation de la demande en analyse. 

Choisissez votre type de nœud pour bénéficier d'une valeur optimale pour vos charges de travail : vous pouvez choisir parmi trois types d'instances pour optimiser Amazon Redshift en fonction de vos besoins en matière d'entreposage de données.

Les nœuds RA3 vous permettent de dimensionner le stockage indépendamment du calcul. Avec RA3, vous disposez d'un entrepôt de données hautes performances qui stocke les données dans une couche de stockage distincte. Il vous suffit de dimensionner l'entrepôt de données en fonction des performances de requête dont vous avez besoin.

Les nœuds de calcul dense (DC) vous permettent de créer des entrepôts de données à très hautes performances, utilisant des CPU rapides, une grande quantité de RAM et des disques SSD. Ils constituent le meilleur choix pour un volume inférieur à 500 Go de données.

Les nœuds DS2 (de stockage dense) vous permettent de créer de grands entrepôts de données à l'aide de disques durs pour un prix avantageux lorsque vous achetez les instances réservées sur 3 ans, ce qui en fait le type de nœud le plus rentable pour les lourdes charges de travail de stockage. La plupart des clients qui exploitent des clusters DS2 peuvent migrer leurs charges de travail vers des clusters RA3 et bénéficier de performances et d'une capacité de stockage 2 fois plus élevées pour un prix équivalent à celui des clusters DS2.
Pour ajuster la taille de votre cluster ou modifier le type de nœuds, il vous suffit de lancer un seul appel d'API ou d'effectuer quelques clics dans la console AWS. Pour plus d'informations, consultez la page Tarification.

Gestion simple

Amazon Redshift automatise les tâches de maintenance courantes pour que vous puissiez vous concentrer sur vos informations de données, et non sur votre entrepôt de données.

Mise en service automatisée : Amazon Redshift est facile à configurer et à utiliser. Vous pouvez déployer un nouvel entrepôt de données en quelques clics seulement dans la console AWS, et Amazon Redshift met automatiquement l'infrastructure en service pour vous. La plupart des tâches administratives, telles que les sauvegardes et la réplication, sont automatisées. Lorsque vous voulez prendre le contrôle, vous disposez d'options pour vous aider à procéder à des ajustements en fonction de vos charges de travail spécifiques. Les nouvelles fonctionnalités sont publiées de manière transparente, ce qui élimine la nécessité de planifier et d'appliquer les mises à jour et les correctifs.

Sauvegardes automatisées : les données d'Amazon Redshift sont automatiquement sauvegardées sur Amazon S3 et Amazon Redshift peut répliquer vos instantanés de façon asynchrone sur S3 dans une autre région à des fins de reprise après sinistre. Vous pouvez utiliser n'importe quel instantané système ou utilisateur pour restaurer votre cluster à partir d'AWS Management Console ou des API Redshift. Votre cluster est disponible dès que les métadonnées système ont été restaurées. Vous pouvez même commencer à lancer des requêtes tandis que vos données utilisateur sont différées en arrière-plan.

Tolérance aux pannes : de nombreuses fonctionnalités renforcent la fiabilité de votre cluster d'entrepôts de données. Par exemple, Amazon Redshift surveille en permanence l'état du cluster et relance automatiquement la réplication des données en cas de lecteurs défaillants. Il remplace également les nœuds si nécessaire pour la tolérance aux pannes.

Interrogation flexible : Amazon Redshift vous permet d'exécuter des requêtes dans la console ou de connecter des outils client SQL, des bibliothèques ou des outils d'informatique décisionnelle. L'éditeur de requête figurant dans la console AWS fournit une interface puissante qui permet d'exécuter des requêtes SQL sur des clusters Amazon Redshift et d'afficher les résultats et le plan d'exécution des requêtes (pour les requêtes exécutées sur des nœuds de calcul) adjacents à vos requêtes.

Traitement natif des données spatiales : Amazon Redshift prend en charge les fonctionnalités natives de traitement des données spatiales. Cette fonctionnalité permet aux clients de stocker, récupérer et traiter des données spatiales et d'ouvrir de manière transparente de nouvelles perspectives commerciales en intégrant des données spatiales dans vos requêtes analytiques. Amazon Redshift fournit un type de données polymorphe, GEOMETRY, qui prend en charge de nombreuses formes géométriques telles que Point, Linestring, Polygon, etc. Redshift ajoute également des fonctions SQL pour élaborer des formes géométriques, importer, exporter, accéder à et traiter des données spatiales. Vous pouvez ajouter des colonnes GEOMETRY aux tables Redshift et écrire des requêtes SQL couvrant les données spatiales et non spatiales. Grâce à la possibilité qu'offre Redshift d'interroger facilement des data lakes, vous pouvez également élargir le traitement spatial aux data lakes en intégrant des tables externes dans les requêtes spatiales.

Intégré à des outils tiers : plusieurs options permettent d'améliorer Amazon Redshift à l'aide des outils et experts leaders sur le marché pour le chargement, la transformation et la visualisation des données. Nos nombreux partenaires ont certifié que leurs solutions fonctionnaient avec Amazon Redshift.

Niveau de sécurité et de conformité le plus élevé

AWS dispose de capacités de sécurité complètes pour satisfaire les besoins les plus exigeants, et Amazon Redshift fournit une sécurité opérationnelle des données sans frais supplémentaires.

Chiffrement de bout en bout : quelques paramètres suffisent à configurer Amazon Redshift de façon à ce qu'il utilise SSL pour sécuriser les données en transit et le chiffrement AES 256 à accélération matérielle pour les données au repos. Si vous choisissez d'activer le chiffrement pour les données au repos, toutes les données écrites sur le disque seront également chiffrées, de même que toutes les sauvegardes. Par défaut, Amazon Redshift prend en charge la gestion des clés.

Isolement du réseau : Amazon Redshift vous permet de configurer des règles de pare-feu afin de contrôler l'accès réseau à votre cluster d'entrepôts de données. Vous pouvez exécuter Redshift au sein d'Amazon Virtual Private Cloud (Amazon VPC) afin d'isoler votre cluster d'entrepôts de données dans votre propre réseau virtuel. Ainsi, vous pouvez connecter votre cluster à votre infrastructure informatique existante à l'aide d'une connexion VPN IPsec chiffrée conforme aux normes du secteur.

Audit et conformité : Amazon Redshift s'intègre à AWS CloudTrail pour vous permettre d'auditer tous les appels d'API Redshift. Redshift consigne toutes les opérations SQL, notamment les tentatives de connexion, les requêtes et les modifications apportées à votre entrepôt de données. Vous pouvez accéder à ces journaux en lançant des requêtes SQL sur des tables système, ou choisir d'enregistrer les journaux vers un emplacement sécurisé dans Amazon S3. Amazon Redshift respecte les normes SOC1, SOC2 et SOC3, ainsi que les exigences de la certification de conformité PCI DSS de niveau 1. Pour plus d'informations, consultez la page Conformité dans le Cloud AWS.

Contrôles précis des accès : les contrôles précis de sécurité au niveau des lignes et des colonnes garantissent que les utilisateurs ne voient que les données auxquelles ils doivent avoir accès. Amazon Redshift est intégré à AWS Lake Formation, garantissant que les contrôles d'accès au niveau des colonnes de Lake Formation sont également appliqués pour les requêtes Redshift sur les données dans le data lake.

Apprenez-en davantage sur les nouveautés.

Consultez la documentation Amazon Redshift pour obtenir des informations plus détaillées sur le produit.

En savoir plus sur la tarification d'Amazon Redshift

Visiter la page de tarification
Prêt à concevoir ?
Démarrer avec Amazon Redshift
D'autres questions ?
Contactez-nous