Veröffentlicht am: Feb 4, 2019

Sie können den Quellcode für den AWS Glue Data Catalog-Client für Apache Hive Metastore ab sofort herunterladen. Dieser Client kann auf jedem Amazon EMR-Cluster mit Apache Hive 2.x ausgeführt werden, das den AWS Glue Data Catalog als externen Hive Metastore verwendet.

Der AWS Glue Data Catalog ist ein vollständig verwaltetes, Apache Hive Metastore-fähiges Metadaten-Repository. Kunden können den Datenkatalog als zentrales Repository für die Speicherung struktureller und operativer Metadaten für ihre Daten verwenden. AWS Glue bietet eine sofort einsatzbereite Integration mit Amazon EMR, mit der Kunden den AWS Glue Data Catalog als Ersatz für einen externen Hive Metastore verwenden können. Weitere Informationen finden Sie in unserer Dokumentation.

Dieser Code dient als Referenzimplementierung für den Aufbau eines Hive Metastore-kompatiblen Clients, der eine Verbindung mit AWS Glue Data Catalog herstellt. Mit dieser Version können Kunden und Partner benutzerdefinierte Clients erstellen, mit denen Sie AWS Glue Data Catalog mit anderen Hive-Metastore-kompatiblen Plattform wie z. B. anderen Hadoop- und Apache Spark-Distributionen verwenden können. Weitere Informationen finden Sie in unserem GitHub Repository.