Cloud AWS
Cloud AWS
Lancer un essai gratuit

Amazon Redshift est un service d'entrepôt de données rapide et entièrement géré. Il permet d'analyser de manière simple et économique toutes vos données grâce à vos outils d'informatique décisionnelle existants et à une syntaxe SQL standard. Vous pouvez ainsi exécuter des requêtes analytiques complexes sur plusieurs pétaoctets de données structurées en utilisant l'optimisation de requêtes sophistiquée, le stockage en colonnes sur des disques locaux hautes performances et l'exécution de requêtes massivement parallèle. Vous obtenez alors plus de résultats à la seconde. Avec Amazon Redshift, vous pouvez commencer par un faible volume à seulement 0,25 USD de l'heure, sans engagement, puis l'augmenter pour atteindre plusieurs pétaoctets de données à un tarif de 1 000 USD par téraoctet et par an, soit dix fois moins que la majorité des solutions traditionnelles.

Amazon Redshift inclut également Redshift Spectrum, ce qui vous permet d'exécuter directement des requêtes SQL sur plusieurs exaoctets de données non structurées dans Amazon S3. Aucun chargement ni aucune transformation ne sont nécessaires, et vous pouvez utiliser des formats de données ouverts, notamment Avro, CSV, Grok, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile et TSV. Redshift Spectrum dimensionne automatiquement la capacité de calcul de la requête selon les données extraites, si bien que les requêtes adressées à Amazon S3 s'exécutent rapidement, quelle que soit la taille de l'ensemble de données. En savoir plus sur Redshift Spectrum »

Des performances constantes et rapides

Rapidité

Amazon Redshift fournit des performances de requête rapides grâce à la méthode de stockage en colonne, qui permet d'améliorer l'efficacité en I/O, et en exécutant des requêtes en parallèle sur plusieurs nœuds. La vitesse de chargement des données évolue de façon linéaire en fonction de la taille du cluster, et des possibilités d'intégration existent avec Amazon S3, Amazon DynamoDB, Amazon EMR, Amazon Kinesis ou n'importe quel hôte compatible SSH.

Hautement évolutif

Peu coûteux

Vous ne payez que ce que vous utilisez. Un nombre illimité d'utilisateurs peuvent réaliser un nombre illimité d'analyses sur toutes vos données pour seulement 1 000 USD par téraoctet et par an, soit 1/10e du coût des solutions traditionnelles d'entreposage de données. La taille des données de la plupart des utilisateurs est divisée par trois ou quatre après compression, si bien que les coûts sont réduits à 250-333 USD par téraoctet non compressé par an.

Performances constantes et rapides

Extensible

Redshift Spectrum permet d'exécuter des requêtes sur plusieurs exaoctets de données dans Amazon S3 aussi facilement que s'il s'agissait de pétaoctets de données sur des disques locaux dans Amazon Redshift, en utilisant la même syntaxe SQL et les mêmes outils d'informatique décisionnelle que vous utilisez aujourd'hui. Vous pouvez stocker des données hautement structurées et consultées fréquemment sur des disques locaux Redshift, conserver de grands volumes de données non structurées dans un « lac de données » Amazon S3 et effectuer aisément des requêtes dans les deux.

Flexible

Simple

Amazon Redshift vous permet d'automatiser facilement la plupart des tâches administratives courantes pour gérer, surveiller et mettre à l'échelle votre entrepôt de données. En gérant toutes ces tâches fastidieuses et chronophages, Amazon Redshift vous libère du temps afin de vous consacrer à vos données et à vos opérations.

Hautement évolutif

Évolutif

Vous pouvez facilement redimensionner votre cluster en fonction de l'évolution de vos besoins en matière de performances et de capacités, en quelques clics dans la console ou via un simple appel d'API.

Flexible

Sécurisé

Les fonctions de sécurité sont intégrées. Vous pouvez chiffrer des données au repos et en transit à l'aide des protocoles SSL et AES 256 à accélération matérielle, isoler vos clusters grâce à Amazon VPC et même gérer vos clés avec AWS Key Management Service (KMS) et des modules de sécurité matériels (HSM).

Programmation centrée sur les événements

Compatible

Amazon Redshift prend en charge le code SQL standard et fournit des pilotes JDBC et ODBC personnalisés que vous pouvez télécharger à partir de la console. Vous pouvez ainsi utiliser un grand choix de clients SQL que vous connaissez bien. Vous pouvez également utiliser les pilotes PostgreSQL JDBC et ODBC standard.

Optimisé pour l'entreposage de données

Amazon Redshift repose sur différentes innovations afin d'offrir des performances très élevées en matière d'interrogation sur des ensembles de données dont la taille peut aller d'une centaine de gigaoctets à un exaoctet et plus. Pour des données locales de plusieurs pétaoctets, le service utilise le stockage en colonnes, la compression de données et le mappage de zones afin de réduire la quantité d'I/O nécessaires à l'exécution des requêtes. Amazon Redshift dispose d'une architecture d'entrepôt de données à traitement massivement parallèle (MPP, Massively Parallel Processing), qui lui permet de traiter en parallèle les opérations SQL et de les distribuer afin d'exploiter toutes les ressources disponibles. Le matériel sous-jacent est conçu pour un traitement très performant, exploitant le stockage local associé pour optimiser le débit entre les CPU et les lecteurs, ainsi qu'un réseau maillé 10 GigE afin de maximiser le débit entre les nœuds. Pour des données de plusieurs pétaoctets dans Amazon S3, Amazon Redshift génère un plan de requête optimal qui minimise le volume de données analysé et délègue l'exécution des requêtes à un groupe d'instances Redshift Spectrum qui évolue automatiquement, si bien que les requêtes s'exécutent rapidement, quelle que soit la taille des données.

A l'échelle du pétaoctet

En quelques clics dans la console ou via un simple appel d'API, vous pouvez facilement modifier le nombre ou le type de nœuds de votre entrepôt de données et augmenter votre configuration jusqu'à plusieurs pétaoctets de données utilisateurs compressées. Les nœuds de stockage denses (DS) vous permettent de créer de très grands entrepôts de données basés sur des disques durs, à des prix très compétitifs. Les nœuds de calcul denses (DC) vous permettent de créer des entrepôts de données à très hautes performances, utilisant des CPU rapides, une grande quantité de RAM et des disques SSD. Au cours du redimensionnement, Amazon Redshift vous permet de continuer à interroger votre entrepôt de données en lecture seule jusqu'à ce que le nouveau cluster soit entièrement mis en service et prêt à l'emploi.

Exécution de requêtes dans votre « lac de données » Amazon S3

Redshift Spectrum vous permet d'exécuter des requêtes par rapport à des exaoctets de données non structurées dans Amazon S3, sans qu'un chargement ou une ETL ne soit nécessaire. Lorsque vous envoyez une requête, elle est redirigée vers le point de terminaison SQL d'Amazon Redshift, qui génère et optimise un plan de requête. Amazon Redshift détermine si les données sont locales ou dans Amazon S3, génère un plan pour minimiser le volume de données d'Amazon S3 qui doivent être lues, effectue des requêtes dans les programmes d'exécution d'Amazon Redshift Spectrum au sein d'un groupe de ressources partagées et conserve les résultats dans votre cluster Amazon Redshift en cas de traitement restant.

Aucuns frais initiaux

Vous payez uniquement les ressources que vous mettez en service. Vous pouvez opter pour la tarification à la demande, sans frais initiaux ou engagement à long terme, ou obtenir des tarifs considérablement réduits en optant pour des instances réservées. La tarification à la demande commence à seulement 0,25 USD de l'heure par nœud DC1.Large de 160 Go, ou 0,85 USD de l'heure par nœud DS2.XLarge de 2 To. Avec les instances réservées avec frais initiaux partiels, vous pouvez réduire votre prix effectif pour atteindre seulement 0,10 USD de l'heure par nœud DC1.Large (5 500 USD par To et par an) ou 0,228 USD de l'heure par nœud DS2.XLarge (999 USD par To et par an). Les requêtes Redshift Spectrum sont facturées à hauteur de 5 USD par To analysé depuis S3. Pour plus d'informations, consultez la page de tarification d'Amazon Redshift.

Tolérant aux pannes

Amazon Redshift possède de nombreuses fonctionnalités qui renforcent la fiabilité de votre cluster d'entrepôts de données. Toutes les données écrites sur un nœud de votre cluster sont automatiquement répliquées au niveau des autres nœuds au sein du cluster. De plus, toutes les données sont sauvegardées de manière continue dans Amazon S3. Amazon Redshift surveille en permanence l'état du cluster et relance automatiquement la réplication des données en cas de lecteurs défaillants. Il remplace également les nœuds si nécessaire.

Sauvegardes automatisées

Amazon Redshift sauvegarde automatiquement et en continu les nouvelles données sur Amazon S3. Amazon Redshift conserve les instantanés en fonction d'une durée définie par l'utilisateur. Cette durée peut varier entre 1 et 35 jours. Vous pouvez capturer vos propres instantanés à tout moment. Ceux-ci sont conservés jusqu'à ce que vous les supprimiez explicitement. Amazon Redshift peut également répliquer vos instantanés de façon asynchrone sur S3, dans une autre région, à des fins de reprise après sinistre. Une fois que vous avez supprimé votre cluster, vos instantanés système sont supprimés, mais vos instantanés utilisateur restent disponibles jusqu'à ce que vous les supprimiez de manière explicite.

Restaurations rapides

Vous pouvez utiliser n'importe quel instantané système ou utilisateur pour restaurer votre cluster à partir d'AWS Management Console ou des API Amazon Redshift. Votre cluster est disponible dès que les métadonnées système ont été restaurées. Vous pouvez même commencer à lancer des interrogations tandis que vos données utilisateur sont différées en arrière-plan.

Chiffrement

Quelques paramètres suffisent à configurer Amazon Redshift de façon à ce qu'il utilise SSL pour sécuriser les données en transit, et le protocole de chiffrement AES 256 avec accélération matérielle pour les données au repos. Si vous choisissez d'activer le chiffrement pour les données au repos, toutes les données écrites sur le disque seront également chiffrées, de même que toutes les sauvegardes. Par défaut, Amazon Redshift se charge de la gestion des clés. Néanmoins, vous avez la possibilité de gérer vos clés à l'aide de vos propres modules de sécurité matériels (HSM), d'AWS CloudHSM ou d'AWS Key Management Service.

Isolement du réseau

Amazon Redshift vous permet de configurer des règles de pare-feu afin de contrôler l'accès réseau à votre cluster d'entrepôts de données. Vous pouvez exécuter Amazon Redshift au sein d'Amazon VPC afin d'isoler votre cluster d'entrepôts de données dans votre propre réseau virtuel. Ainsi, vous pouvez connecter votre cluster à votre infrastructure informatique existante à l'aide d'une connexion VPN IPsec cryptée conforme aux normes du secteur.

Audit et conformité

Amazon Redshift s'intègre à AWS CloudTrail pour vous permettre d'auditer tous les appels d'API Redshift. Amazon Redshift consigne également toutes les opérations SQL, notamment les tentatives de connexion, les requêtes et les modifications apportées à votre base de données. Vous pouvez accéder à ces journaux en lançant des requêtes SQL sur des tables système, ou les télécharger vers un emplacement sécurisé dans Amazon S3. Amazon Redshift respecte les normes SOC1, SOC2 et SOC3, ainsi que les exigences de la certification de conformité PCI DSS de niveau 1. Pour plus d'informations, consultez la page Conformité dans le cloud AWS.

440x220_APN-Blog

Amazon Redshift Spectrum permet d'étendre les capacités d'analyse d'Amazon Redshift et d'aller au-delà des données stockées sur les disques locaux de votre entrepôt de données, afin d'interroger de grandes quantités de données dans votre « lac de données » Amazon S3 sans avoir à charger ou à transformer de données. Dans cet article de blog, nous présentons 10 bonnes pratiques importantes pour Amazon Redshift Spectrum classées dans différents groupes fonctionnels.

Lire l'article complet »

Avec Amazon Redshift Spectrum, les utilisateurs d'Amazon Redshift peuvent interroger facilement leurs données dans Amazon S3. Redshift Spectrum exploite directement vos données source dans leur format d'origine (notamment Avro, CSV, Grok, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile et TSV). Ainsi, aucun chargement ni aucune transformation de données ne sont nécessaires.

Lire l'article complet »

Afin de vous permettre de traiter vos données en l'état et sur place tout en tirant parti de la puissance et de la flexibilité d'Amazon Redshift, nous lançons Amazon Redshift Spectrum. Vous pouvez utiliser Spectrum pour exécuter des requêtes complexes sur des données stockées dans Amazon Simple Storage Service (S3), sans qu'un chargement ou une préparation des données ne soit nécessaire.

Lire l'article complet »

La compression en colonnes est une technologie importante dans Amazon Redshift. Elle permet de réduire les coûts des clients en augmentant la capacité de stockage effective de nos nœuds et d'améliorer les performances en limitant les I/O requises pour traiter les requêtes SQL. L'amélioration de l'efficacité des I/O est primordiale pour l'entreposage des données. L'an dernier, nos améliorations des I/O ont permis de doubler le débit des requêtes. Nous allons aborder certaines des améliorations de compression récemment ajoutées à Amazon Redshift.

Lire l'article complet »

Pour obtenir la liste complète des articles de blog relatifs à Amazon Redshift, consultez la page des articles de blog »

Pour plus d'informations sur les nouvelles fonctionnalités d'Amazon Redshift, consultez la page des nouveautés »

Essayez Amazon Redshift gratuitement. Obtenez 750 heures DC1.Large gratuites par mois pendant 2 mois. Pour commencer l'essai gratuit, créez un compte AWS et connectez-vous à la console Amazon Redshift. Lancez ensuite un cluster Amazon Redshift et sélectionnez le type de nœud DC1.Large. Pour demander de l'assistance pour votre démonstration de faisabilité ou votre évaluation, cliquez ici.

 

Démarrer