Publié le: Dec 3, 2019
Vous pouvez désormais transférer les résultats d’une requête Amazon Redshift vers le lac de données Amazon S3, et ce sous forme Apache Parquet, un format de stockage en colonnes ouvert et efficace dédié à l’analyse. Le format Parquet est jusqu’à deux fois plus rapide à décharger et consomme jusqu’à six fois mois de stockage dans Amazon S3, en comparaison avec les formats texte. Cela vous permet de sauvegarder la transformation et l’enrichissement des connées que vous avez faits dans Amazon Redshift dans votre lac de connées Amazon S3 dans un format ouvert. Vous pouvez ainsi analyser vos données avec Redshift Spectrum et d’autres services AWS comme Amazon Athena, Amazon EMR et Amazon SageMaker.
Vous pouvez spécifier une ou plusieurs colonnes de partition afin que vos données déchargées soient automatiquement partitionnées à l’intérieur de dossiers dans votre compartiment Amazon S3. Par exemple, vous pouvez choisir de décharger vos données marketing et de les partitionner dans des colonnes par année, par mois et par jour. Cela permet à vos requêtes de bénéficier de l’élagage de partition et d’éviter de scanner des partitions non pertinentes. Résultat : la performance des requêtes est améliorée et les coûts sont réduits.
Pour plus d'informations, consultez la documentation Amazon Redshift.
L’exportation de lacs de données Amazon Redshift est supportée avec la version Redshift 1.0.10480 ou ultérieure. Consultez le tableau des régions AWS pour connaître la disponibilité d'Amazon Redshift.