Publié le: Sep 24, 2020
Vous pouvez désormais utiliser Amazon Redshift afin d'exécuter des requêtes en lecture sur des tables dans votre lac de données Amazon S3, avec Apache Hudi et Delta Lake open source. Amazon Redshift Spectrum, une fonction d'Amazon Redshift, vous permet d'interroger votre lac de données S3 directement depuis votre cluster Redshift, sans y charger les données, ce qui réduit le temps d'analyse.
Redshift Spectrum alimente l'architecture lake house, ce qui vous permet d'interroger vos données dans Redshift, lake house et dans les bases de données opérationnelles sans ETL ou chargement des données. Redshift Spectrum prend en charge les formats ouverts tels que Parquet, ORC, JSON et CSV. Redshift Spectrum prend également en charge l'interrogation des données imbriquées avec des types de données complexes tels que struct, array ou map.
Redshift Spectrum vous permet de lire le dernier instantané des tables copie-sur-écriture (CoW) d'Apache Hudi version 0.5.2. Vous pouvez lire les dernières tables de Delta Lake version 0.5.0 via les fichiers manifestes.
Pour en savoir plus, consultez la section Création d'une table externe pour Apache Hudi ou Delta Lake dans le Guide du développeur Amazon Redshift Database.