Amazon Redshift est un service d'entrepôt de données rapide, entièrement géré et doté d'une capacité de plusieurs pétaoctets. Elle permet d'analyser de manière simple et rentable toutes vos données grâce à vos outils d'informatique décisionnelle existants. Vous pouvez commencer par un faible volume à 0,25 USD de l'heure, sans engagement, puis l'augmenter pour atteindre plusieurs pétaoctets à un tarif de 1 000 USD par téraoctet et par an, soit dix fois moins que la majorité des solutions classiques. Les clients constatent généralement une compression trois fois supérieure, qui réduit leurs coûts à 333 USD par téraoctet non compressé et par an.

Essayez Amazon Redshift gratuitement

Lancer un essai gratuit
En savoir plus

Obtenez 750 heures DC1.Large gratuites par mois pendant 2 mois.  Pour démarrer l'essai :

Créez un compte AWS et connectez-vous à la console Amazon Redshift

Lancez un cluster Amazon Redshift et sélectionnez le type de nœud DC1.Large

Rapportez et recevez les données gratuitement à l'aide de nos Essais gratuits pour les partenaires




Amazon Redshift fournit des performances d'interrogation rapides grâce à la méthode de stockage en colonne, qui permet d'améliorer l'efficacité en E/S, et en exécutant des requêtes en parallèle sur plusieurs nœuds. Amazon Redshift possède des pilotes JDBC et ODBC personnalisés que vous pouvez télécharger à partir de l'onglet Connect Client de notre console. Vous pouvez ainsi utiliser un grand choix de clients SQL que vous connaissez bien. Vous pouvez également utiliser les pilotes PostgreSQL JDBC et ODBC standard. La vitesse de chargement des données évolue de façon linéaire en fonction de la taille du cluster, et des possibilités d'intégration existent avec Amazon S3, Amazon DynamoDB, Amazon Elastic MapReduce, Amazon Kinesis ou n'importe quel hôte compatible SSH.

L'architecture d'entrepôt de données d'Amazon Redshift vous permet d'automatiser la plupart des tâches administratives courantes associées à la mise en service, la configuration et la surveillance d'un entrepôt de données dans le cloud. Des sauvegardes vers Amazon S3 sont automatiquement réalisées en continu et de manière incrémentielle. Les restaurations sont rapides : vous pouvez commencer à lancer des requêtes en quelques minutes, tandis que vos données sont différées en arrière-plan. La reprise après sinistre sur plusieurs régions peut être activée en quelques clics.

Les fonctions de sécurité sont intégrées. Vous pouvez chiffrer des données au repos et en transit à l'aide des protocoles SSL et AES 256 à accélération matérielle, isoler vos clusters grâce à Amazon VPC et même gérer vos clés avec AWS Key Management Service (KMS) et des modules de sécurité matériels (HSM). L'ensemble des appels d'API, tentatives de connexion, requêtes et modifications apportées au cluster sont consignés et contrôlables. Vous pouvez utiliser AWS CloudTrail pour auditer les appels d'API Redshift.

Amazon Redshift repose sur différentes innovations afin d'offrir des performances très élevées en matière d'interrogation sur des ensembles de données dont la taille peut aller d'une centaine de gigaoctets à plusieurs pétaoctets. Le service utilise le stockage en colonnes, la compression de données et le mappage de zones afin de réduire la quantité d'E/S nécessaires à l'exécution des requêtes. Amazon Redshift dispose d'une architecture d'entrepôt de données à traitement massivement parallèle (MPP, Massively Parallel Processing), qui lui permet de traiter en parallèle les opérations SQL et de les distribuer afin d'exploiter toutes les ressources disponibles. Le matériel sous-jacent est conçu pour un traitement très performant, exploitant le stockage local associé pour optimiser le débit entre les CPU et les lecteurs, ainsi qu'un réseau maillé 10 GigE afin de maximiser le débit entre les nœuds.

En quelques clics dans AWS Management Console ou via un simple appel d'API, vous pouvez facilement ajuster le nombre ou le type de nœuds de votre entrepôt de données dans le cloud à mesure que vos performances ou vos besoins en capacités évoluent. Les nœuds de stockage denses (DS) vous permettent de créer de très grands entrepôts de données basés sur des disques durs, à des prix très compétitifs. Les nœuds de calcul denses (DC) vous permettent de créer des entrepôts de données à très hautes performances, utilisant des CPU rapides, une grande quantité de RAM et des disques SSD. Avec Amazon Redshift, vous pouvez commencer avec un seul nœud DC1.Large de 160 Go, puis augmenter votre configuration jusqu'à plusieurs pétaoctets de données utilisateur compressées, à l'aide de nœuds DS2.8XLarge de 16 To. Au cours du redimensionnement, Amazon Redshift place votre cluster existant en lecture seule, met en service un nouveau cluster de la taille de votre choix, puis effectue une copie parallèle des données de votre ancien cluster vers le nouveau. Pendant le dimensionnement du nouveau cluster, vous pouvez continuer à interroger votre ancien cluster. Une fois vos données copiées dans le nouveau cluster, Amazon Redshift redirige automatiquement les interrogations vers votre nouveau cluster et supprime l'ancien cluster.

Vous payez uniquement les ressources que vous mettez en service. Vous pouvez opter pour la tarification à la demande, sans frais initiaux ou engagement à long terme, ou obtenir des tarifs considérablement réduits en optant pour des instances réservées. La tarification à la demande commence à seulement 0,25 USD de l'heure par nœud DC1.Large de 160 Go, ou 0,85 USD de l'heure par nœud DS2.XLarge de 2 To. Avec les instances réservées avec frais initiaux partiels, vous pouvez réduire votre prix effectif pour atteindre seulement 0,10 USD de l'heure par nœud DC1.Large (5 500 USD par To et par an) ou 0,228 USD de l'heure par nœud DS2.XLarge (999 USD par To et par an). Pour en savoir plus, consultez la page de présentation des tarifs Amazon Redshift.

En quelques clics dans AWS Management Console ou via de simples appels d'API, vous pouvez créer un cluster, définir sa taille, le type de nœud sous-jacent, ainsi que le profil de sécurité. Amazon Redshift met en service vos nœuds, configure les connexions entre eux et sécurise le cluster. Votre entrepôt de données est opérationnel en quelques minutes.

Amazon Redshift prend en charge toutes les tâches requises pour gérer, surveiller et mettre à l'échelle votre entrepôt de données, de la surveillance de l'état de santé du cluster à l'application de correctifs et mises à jour, en passant par la création de sauvegardes. Vous pouvez facilement redimensionner votre cluster en fonction de l'évolution de vos besoins en matière de performances et de capacités. En gérant toutes ces tâches fastidieuses et chronophages, Amazon Redshift vous libère du temps afin de vous consacrer à vos données et à vos opérations.

Amazon Redshift possède de nombreuses fonctionnalités qui renforcent la fiabilité de votre cluster d'entrepôts de données. Toutes les données écrites sur un nœud de votre cluster sont automatiquement répliquées au niveau des autres nœuds du cluster. De plus, toutes les données sont sauvegardées de manière continue dans Amazon S3. Amazon Redshift surveille en permanence l'état du cluster et relance automatiquement la réplication des données en cas de lecteurs défaillants. Il remplace également les nœuds si nécessaire.

La fonction d'instantané automatique d'Amazon Redshift sauvegarde de manière continue les nouvelles données du cluster sur Amazon S3. Les instantanés sont continus, incrémentiels et automatiques. Amazon Redshift conserve les instantanés en fonction d'une durée définie par l'utilisateur. Cette durée peut varier entre 1 et 35 jours. Vous pouvez également capturer vos propres instantanés à tout moment, afin de pouvoir exploiter tous les instantanés système existants et de les conserver jusqu'à ce que vous les supprimiez de manière explicite. Redshift peut également répliquer vos instantanés de façon asynchrone sur S3, dans une autre région, à des fins de reprise après sinistre. Une fois que vous avez supprimé votre cluster, vos instantanés système sont supprimés, mais vos instantanés utilisateur restent disponibles jusqu'à ce que vous les supprimiez de manière explicite.

Vous pouvez utiliser n'importe quel instantané système ou utilisateur pour restaurer votre cluster à partir d'AWS Management Console ou des API Amazon Redshift. Votre cluster est disponible dès que les métadonnées système ont été restaurées. Vous pouvez même commencer à lancer des interrogations tandis que vos données utilisateur sont différées en arrière-plan.

Quelques paramètres suffisent à configurer Amazon Redshift de façon à ce qu'il utilise SSL pour sécuriser les données en transit, et le protocole de chiffrement AES 256 avec accélération matérielle pour les données au repos. Si vous choisissez d'activer le chiffrement pour les données au repos, toutes les données écrites sur le disque seront également chiffrées, de même que toutes les sauvegardes. Par défaut, Amazon Redshift se charge de la gestion des clés. Néanmoins, vous avez la possibilité de gérer vos clés à l'aide de vos propres modules de sécurité matériels (HSM), d'AWS CloudHSM ou d'AWS Key Management Service.

Amazon Redshift vous permet de configurer des règles de pare-feu afin de contrôler l'accès réseau à votre cluster d'entrepôts de données. Vous pouvez exécuter Amazon Redshift au sein d'Amazon Virtual Private Cloud (Amazon VPC) afin d'isoler votre cluster d'entrepôts de données dans votre propre réseau virtuel. Ainsi, vous pouvez connecter votre cluster à votre infrastructure informatique existante à l'aide d'une connexion VPN IPsec cryptée conforme aux normes du secteur.

Amazon Redshift s'intègre à AWS CloudTrail pour vous permettre d'auditer tous les appels d'API Redshift. Amazon Redshift consigne également toutes les opérations SQL, notamment les tentatives de connexion, les requêtes et les modifications apportées à votre base de données. Vous pouvez accéder à ces journaux en lançant des requêtes SQL sur des tables système, ou les télécharger vers un emplacement sécurisé dans Amazon S3. Amazon Redshift respecte les normes SOC1, SOC2 et SOC3, ainsi que les exigences de la certification de conformité PCI DSS de niveau 1. Pour en savoir plus, consultez le Centre de sécurité et de conformité AWS.

Amazon Redshift est une solution d'entrepôt de données SQL qui utilise les connexions ODBC et JDBC conformes aux normes du secteur. Vous pouvez télécharger les pilotes JDBC et ODBC personnalisés à partir de l'onglet Connect Client de notre console. De nombreux fournisseurs connus certifient Amazon Redshift dans leurs offres afin de vous permettre de continuer à utiliser les outils auxquels vous avez recours actuellement. Pour en savoir plus, consultez la page de présentation des partenaires Amazon Redshift.

Amazon Redshift fonctionne avec d'autres services AWS et dispose de commandes intégrées pour charger les données en parallèle sur chaque nœud à partir d'Amazon S3, d'Amazon DynamoDB ou de vos instances EC2 et serveurs sur site, à l'aide de SSH. AWS Data PipelineAmazon Kinesis et AWS Lambda s'intègrent à Amazon Redshift comme cible des données. Vous pouvez également charger des données en diffusion continue dans Amazon Redshift en utilisant Amazon Kinesis Firehose.