Veröffentlicht am: Oct 16, 2018

AWS Glue Data Catalog ist ein verwaltetes Metadaten-Repository, das mit Amazon EMR, Amazon Athena, Amazon Redshift Spectrum und AWS Glue ETL integriert ist. Der Data Catalog vereinfacht die Metadatenverwaltung und bietet eine automatische Schema-Erkennung und Schema-Versionshistorie. Mit Amazon EMR können Sie den Data Catalog als standardmäßigen Metastore für Spark, Presto und Hive verwenden, statt einen On-Cluster- oder selbstverwalteten Hive Metastore zu verwenden. Mit der kürzlichen Veröffentlichung ressourcenbasierter Richtlinien und Berechtigungen auf Ressourcenebene für den Data Catalog können Sie jetzt den EMR-Zugriff auf Katalogobjekte wie Datenbanken und Tabellen einschränken oder zulassen. Die Veröffentlichung ermöglicht es außerdem EMR-Clustern in unterschiedlichen Konten, auf einen einzigen Data Catalog zuzugreifen. Somit wird ein kontoübergreifender Zugriff ermöglicht. Amazon S3-Richtlinien bestimmen weiterhin den Zugriff auf in Amazon S3 gespeicherte Daten, wobei Data Catalog-Richtlinien eine weitere Schutzschicht hinzufügen. Weitere Informationen