Amazon Redshift étend les requêtes d'entrepôt de données à votre lac, sans chargement requis. Vous pouvez exécuter des requêtes analytiques sur des pétaoctets de données stockées localement dans Redshift, et directement sur des exaoctets de données stockées dans Amazon S3. Cette solution est facile à configurer, automatise la plupart de vos tâches administratives, et offre des performances rapides à n'importe quelle échelle.

Caractéristiques principales

Des performances plus rapides

Massivement parallèle : Amazon Redshift offre des performances de requêtes rapides sur des ensembles de données d'une taille allant de plusieurs gigaoctets à plusieurs exaoctets. Redshift utilise le stockage en colonnes, la compression de données et le mappage de zones afin de réduire la quantité d'E/S nécessaires à l'exécution des requêtes. Il utilise une architecture d'entrepôt de données en traitement massivement parallèle pour mettre en parallèle et distribuer les opérations SQL afin de tirer profit de toutes les ressources disponibles. Le matériel sous-jacent est conçu pour un traitement très performant, exploitant le stockage local associé pour optimiser le débit entre les CPU et les lecteurs, ainsi qu'un réseau maillé à bande passante élevée afin de maximiser le débit entre les nœuds.

Apprentissage automatique : Amazon Redshift utilise l'apprentissage automatique pour offrir un rendement élevé en fonction de vos charges de travail. Redshift utilise des algorithmes sophistiqués pour prédire les durées d'exécution des requêtes entrantes, et les affecte à la file d'attente optimale pour optimiser la vitesse de traitement. Par exemple, les requêtes telles que les tableaux de bord et les rapports ayant des exigences élevées en termes de simultanéité sont acheminées vers une file d'attente rapide pour être traitées immédiatement.

Mise en cache des résultats : Amazon Redshift utilise la mise en cache de résultats pour offrir des temps de réaction inférieurs à une seconde pour les requêtes répétées. Les outils de tableau de bord, de visualisation et de veille économique qui exécutent des requêtes répétées voient leurs performances augmenter significativement. Lorsqu'une requête s'exécute, Redshift recherche dans le cache un éventuel résultat mis en cache d'une exécution précédente. Si un résultat mis en cache est trouvé et que les données n'ont pas été modifiées, ce résultat est renvoyé immédiatement au lieu de ré-exécuter la requête.

Facile à configurer, déployer et gérer

Mise en service automatisée : Amazon Redshift est facile à configurer et à utiliser. Vous pouvez déployer un nouvel entrepôt de données en quelques clics seulement dans la console AWS, et Redshift met automatiquement l'infrastructure en service pour vous. La plupart des tâches administratives, telles que les sauvegardes et les réplications, sont automatisées, ce qui vous permet de vous concentrer sur vos données plutôt que sur la gestion administrative. Lorsque vous voulez prendre le contrôle, Redshift offre des options pour vous aider à procéder à des ajustements en fonction de vos charges de travail spécifiques. Les nouvelles fonctionnalités sont publiées de manière transparente, ce qui élimine la nécessité de planifier et d'appliquer les mises à jour et patches.

Sauvegardes automatiques : Amazon Redshift sauvegarde automatiquement et en continu les nouvelles données sur Amazon S3. Redshift peut répliquer vos instantanés (snapshots) de façon asynchrone sur S3, dans une autre région, à des fins de reprise après sinistre. Vous pouvez utiliser n'importe quel instantané système ou utilisateur pour restaurer votre cluster à partir d'AWS Management Console ou des API Redshift. Votre cluster est disponible dès que les métadonnées système ont été restaurées. Vous pouvez même commencer à lancer des requêtes tandis que vos données utilisateur sont différées en arrière-plan.

Tolérant aux pannes : Amazon Redshift possède de nombreuses fonctionnalités qui renforcent la fiabilité de votre cluster d'entrepôts de données. Redshift surveille en permanence l'état du cluster et relance automatiquement la réplication des données en cas de lecteurs défaillants. Il remplace également les nœuds si nécessaire pour la tolérance aux pannes.

Intégré à des outils tiers : améliorez Amazon Redshift en utilisant les outils et experts leaders sur le marché pour le chargement, la transformation et la visualisation des données. Nos nombreux partenaires ont certifié que leurs solutions fonctionnaient avec Amazon Redshift. 

Rentable

Aucun coût initial, payez au fur et à mesure : Amazon Redshift est l'entrepôt de données le plus rentable, et vous payez uniquement pour les ressources que vous allouez. Vous pouvez commencer petit pour seulement 0,25 $ l'heure sans engagement, et passer pour seulement 250 $ à un téraoctet par année. Redshift est le seul entrepôt de données dans le cloud qui offre une tarification à la demande sans coûts initiaux, une tarification d'instance réservée pouvant vous faire économiser jusqu'à 75 % en vous engageant pour une durée de 1 à 3 ans, et une tarification par requête basée sur la quantité de données scannées dans votre lac Amazon S3.  Pour plus d'informations, consultez la page de tarification d'Amazon Redshift.

Choisissez votre type de nœud : vous pouvez sélectionner jusqu'à deux types de nœuds pour optimiser Redshift pour vos besoins d'entreposage de données. Les nœuds de calcul dense (DC) vous permettent de créer des entrepôts de données à très hautes performances, utilisant des CPU rapides, une grande quantité de RAM et des disques SSD. Si vous souhaitez une mise à l'échelle plus importante ou que vous voulez réduire vos coûts, vous pouvez opter pour une solution plus rentable avec nos nœuds de stockage dense (DS), qui utilisent des disques durs de plus grande taille pour un tarif extrêmement réduit. Pour ajuster la taille de votre cluster ou modifier le type de nœuds, il vous suffit de lancer un seul appel d'API ou d'effectuer quelques clics dans la console AWS.

Évolutivité rapide pour répondre à vos besoins

Entreposage de données d'une capacité de plusieurs pétaoctets : Amazon Redshift est une solution simple capable d'opérer une mise à l'échelle rapide lorsque vos besoins évoluent. En quelques clics dans la console ou via un simple appel d'API, vous pouvez facilement ajuster le nombre de nœuds dans votre entrepôt de données et augmenter ou réduire la charge à mesure que vos besoins en capacités évoluent.

Analytique de lacs d'une capacité de plusieurs exaoctets : Redshift Spectrum, une fonction de Redshift, vous permet d'exécuter des requêtes sur plusieurs exaoctets de données dans Amazon S3 sans avoir besoin de charger ou de transformer de données. Vous pouvez utiliser S3 en tant que lac hautement disponible, sécurisé et rentable pour stocker des données illimitées dans des formats de données ouverts.

Simultanéité illimitée : Redshift Spectrum offre une simultanéité illimitée en permettant à de multiples requêtes d'accéder aux mêmes données simultanément dans Amazon S3. Redshift Spectrum exécute les requêtes sur des milliers de nœuds en parallèle pour fournir des résultats rapides, quelle que soit la complexité de la requête ou la quantité de données.

Exécution de requêtes dans votre lac

Lac Amazon S3 : Amazon Redshift est le seul entrepôt de données qui étend vos requêtes à votre lac Amazon S3 sans chargement de données. Vous pouvez exécuter des requêtes sur des formats de fichiers ouverts que vous utilisez déjà, tels qu'Avro, CSV, Grok, JSON, ORC, Parquet, et autres, directement dans S3. Ceci vous donne la flexibilité de stocker des données fortement structurées et fréquemment consultées sur les disques locaux de Redshift, de conserver des exaoctets de données structurées et non structurées dans S3 et d'exécuter des requêtes de manière fluide sur les deux types de données pour fournir des informations uniques, qui seraient impossibles à obtenir par des requêtes sur des ensembles de données indépendants.

Écosystème d'analytique AWS : Amazon Redshift est intégré nativement à l'écosystème d'analytique AWS. AWS Glue peut extraire, transformer et charger (ETL) des données dans Redshift. Amazon Kinesis Data Firehose est la manière la plus facile de capturer, transformer et charger des données de streaming dans Redshift pour une analytique presque en temps réel. Vous pouvez utiliser Amazon QuickSight pour créer des rapports, visualisations et tableaux de bord.  Pour accélérer votre migration vers Amazon Redshift, vous pouvez utiliser gratuitement AWS Database Migration Service (DMS) pendant six mois. En savoir plus »

Sécurisé

Chiffrement de bout en bout : quelques paramètres suffisent à configurer Amazon Redshift de façon à ce qu'il utilise SSL pour sécuriser les données en transit et le chiffrement AES 256 avec accélération matérielle pour les données au repos. Si vous choisissez d'activer le cryptage pour les données au repos, toutes les données écrites sur le disque seront également cryptées, de même que toutes les sauvegardes. Par défaut, Amazon Redshift prend en charge la gestion des clés.

Isolement du réseau : Amazon Redshift vous permet de configurer des règles de pare-feu afin de contrôler l'accès réseau à votre cluster d'entrepôts de données. Vous pouvez exécuter Amazon Redshift au sein d'Amazon VPC afin d'isoler votre cluster d'entrepôts de données dans votre propre réseau virtuel. Ainsi, vous pouvez connecter votre cluster à votre infrastructure informatique existante à l'aide d'une connexion VPN IPsec cryptée conforme aux normes du secteur.

Audit et conformité : Amazon Redshift s'intègre à AWS CloudTrail pour vous permettre d'auditer tous les appels d'API Redshift. Redshift consigne toutes les opérations SQL, notamment les tentatives de connexion, les requêtes et les modifications apportées à votre base de données. Vous pouvez accéder à ces journaux en lançant des requêtes SQL sur des tables système, ou les télécharger vers un emplacement sécurisé dans Amazon S3. Amazon Redshift respecte les normes SOC1, SOC2 et SOC3, ainsi que les exigences de la certification de conformité PCI DSS de niveau 1. Pour plus d'informations, consultez la page Conformité dans le cloud AWS.

En savoir plus sur la tarification d'Amazon Redshift

Visiter la page de tarification
Prêt à concevoir ?
Démarrer avec Amazon Redshift
D'autres questions ?
Contactez-nous