Publié le: Jun 8, 2020
Vous pouvez maintenant écrire les résultats dans une requête Amazon Redshift dans une table externe dans Amazon S3, au format texte ou au format Apache Parquet. Les métadonnées de la table externe seront automatiquement mises à jour et peuvent être stockées dans AWS Glue, AWS Lake Formation ou le catalogue de données de votre metastore Hive. Vous pouvez ainsi facilement partager vos données dans le lac de données afin qu'elles soient immédiatement disponibles pour l'analyse avec Amazon Redshift Spectrum et d'autres services AWS tels qu'Amazon Athena, Amazon EMR et Amazon SageMaker. Amazon Redshift Spectrum vous permet d'alimenter une architecture lake house afin d'interroger et de joindre des données directement dans votre entrepôt de données et votre lac de données.
Pour commencer à écrire dans des tables externes, exécutez simplement CREATE EXTERNAL TABLE AS SELECT pour écrire dans une nouvelle table externe, ou exécutez INSERT INTO pour insérer des données dans une table externe existante. Cela vous permet de simplifier et d'accélérer vos pipelines de traitement de données en utilisant une intégration SQL et transparente familière avec vos outils ETL et BI. Vous pouvez utiliser l'option PARTITIONED BY pour partitionner automatiquement les données et bénéficier de l'élagage de partition afin d'améliorer les performances des requêtes et de minimiser les coûts. Par exemple, vous pouvez écrire vos données marketing dans votre table externe et choisir de les partitionner dans des colonnes par année, par mois et par jour. Pour plus d'informations, consultez la documentation Amazon Redshift pour CREATE EXTERNAL TABLE et INSERT.
La fonctionnalité d'écriture dans des tables externes Amazon Redshift est supportée avec la version Redshift 1.0.15582 ou ultérieure. Consultez le tableau des régions AWS pour connaître la disponibilité d'Amazon Redshift.