Amazon Redshift Spectrum permet d'exécuter des requêtes SQL Amazon Redshift sur plusieurs exaoctets de données dans Amazon S3. Avec Redshift Spectrum, vous pouvez étendre les capacités d'analyse d'Amazon Redshift et aller au-delà des données stockées sur les disques locaux de votre entrepôt de données, afin d'interroger de grandes quantités de données non structurées dans votre « lac de données » Amazon S3 sans avoir à charger ou à transformer de données. Redshift Spectrum applique un processus d'optimisation de requêtes sophistiqué, afin de répartir leur traitement sur plusieurs milliers de nœuds et de recevoir rapidement des résultats, même pour de grands ensembles de données et des requêtes complexes.

Redshift Spectrum interroge directement les données dans Amazon S3 avec les formats de données ouverts que vous utilisez déjà, notamment Avro, CSV, Grok, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile et TSV. Etant donné que Redshift Spectrum prend en charge la même syntaxe SQL qu'Amazon Redshift, vous pouvez exécuter des requêtes sophistiquées avec les outils d'informatique décisionnelle (BI) que vous exploitez aujourd'hui. Il est également possible d'exécuter des requêtes couvrant les données fréquemment accédées et stockées en local dans Amazon Redshift et les ensembles de données complets stockés de façon économique dans Amazon S3.

Redshift Spectrum vous permet de stocker les données où vous le souhaitez, dans le format que vous désirez, prêtes à être traitées quand vous en avez besoin. Redshift Spectrum est proposé sans paiement initial ni engagement : vous ne payez que les requêtes que vous exécutez.

Prêt à lancer vos premières requêtes ?

Démarrer avec Amazon Redshift
Dory_Feature_Start_Querying_Instantly

Avec Amazon Redshift Spectrum, commencez immédiatement à interroger vos données dans Amazon S3, sans chargement ou transformation nécessaire. Il suffit d'enregistrer votre catalogue de données Amazon Athena ou AWSGlue ou votre métamagasin Hive Apache en tant que schéma externe. Vous pouvez utiliser la même syntaxe SQL que vous utilisez pour interroger vos tables Amazon Redshift, ainsi que les outils BI qui prennent actuellement en charge Redshift.

Dory_Feature_Fast_Performance

Amazon Redshift offre des performances ultra rapides, aussi bien pour les analyses ad hoc sur de grands ensembles de données non structurées dans Amazon S3 que pour des analyses fréquentes d'ensembles de données structurées dans des tables Redshift. Vous pouvez garder des données dynamiques dans vos clusters Amazon Redshift pour bénéficier de performances similaires à celles d'un disque local et utiliser Amazon Redshift Spectrum pour étendre vos requêtes vers des données au repos stockées dans Amazon S3, pour une évolutivité illimitée et un coût raisonnable. L'optimisateur de requêtes Amazon Redshift détermine automatiquement la meilleure façon de limiter les données analysées dans Amazon S3 et le nombre de nœuds Redshift Spectrum à utiliser pour la requête.

Dory_Feature_Scalable

Avec Amazon Redshift Spectrum, vous n'avez plus à vous soucier du dimensionnement de votre cluster. Ce service vous permet de séparer les ressources de stockage et de calcul et de les dimensionner indépendamment l'une de l'autre. Il est même possible d'exécuter plusieurs clusters Amazon Redshift pour un même lac de données Amazon S3, pour une capacité de simultanéité illimitée. Redshift Spectrum s'étend automatiquement sur plusieurs milliers d'instances si nécessaire afin d'exécuter rapidement toutes les requêtes, qu'elles soient de l'ordre du téraoctet, du pétaoctet ou de l'exaoctet.

Dory_Feature_Pay_per_query

Avec Amazon Redshift Spectrum, vous ne payez que les requêtes que vous exécutez. La tarification s'élève à 5 USD par téraoctet de données traitées pour exécuter votre requête. Redshift Spectrum peut interroger les données compressées. Il est possible d'économiser 30 à 90 % du coût à la requête et d'améliorer les performances en compressant, en partitionnant et en convertissant les données dans un format à colonnes. Redshift Spectrum ne coûte rien quand vous n'exécutez pas de requêtes. Vous devrez payer les frais de stockage de données d'Amazon S3 et les frais d'instance d'Amazon Redshift pour les clusters utilisés.