Publié le: Oct 16, 2018

Le catalogue de données AWS Glue est un référentiel de métadonnées géré, intégré à Amazon EMR, Amazon Athena, Amazon Redshift Spectrum et AWS Glue ETL. Il simplifie la gestion des métadonnées et apporte une découverte ainsi qu'un historique des versions des schémas automatique. Avec Amazon EMR, vous pouvez utiliser le catalogue de données en tant que metastore par défaut pour Spark, Presto et Hive au lieu d'utiliser un metastore Hive sur cluster ou autogéré. Grâce à la récente mise à jour des politiques basées sur les ressources et des autorisations au niveau des ressources pour le catalogue de données, vous pouvez limiter ou autoriser l'accès d'EMR aux objets de catalogue de données tels que des bases de données et des tables. Cette version permet également aux clusters EMR de différents comptes d'accéder à un seul catalogue de données, permettant ainsi un accès inter-comptes. Les politiques Amazon S3 continuent de régir l'accès aux données stockées dans Amazon S3, les politiques du catalogue de données ajoutant une autre couche de protection. En savoir plus.