Veröffentlicht am: Dec 19, 2022
Sie können Delta-Lake-Tabellen jetzt nahtlos in Amazon Athena abfragen und profitieren so von einer höheren Betriebseffizienz, einer verbesserten Abfrageleistung und geringeren Kosten. Delta Lake ist ein Open-Source-Tabellenformat, das bei der Implementierung moderner Data-Lake-Architekturen hilft, die häufig auf Amazon S3 basieren. Vor dieser Einführung erforderte das Lesen von Delta-Lake-Tabellen in Athena einen komplexen Prozess der Generierung und Verwaltung zusätzlicher Metadatendateien. Jetzt können Sie Athena verwenden, um Delta-Lake-Tabellen ohne diesen zusätzlichen Aufwand direkt abzufragen.
Athena ermöglicht interaktive Analysen und Dashboard-Reporting für Data Lakes im Delta-Lake-Format. Jetzt stehen Ihre Delta-Lake-Tabellenaktualisierungen zur Analyse in Athena zur Verfügung, sobald sie abgeschlossen sind. Athena verwendet Metadaten, die in Delta-Lake-Dateien enthalten sind, um Ihre Abfragen zu optimieren, sodass Sie die Kosten für Datenscans senken und die Leistung der Athena-Abfragen um bis zu 40 % verbessern können. Athena erleichtert Ihnen das Erstellen und Verwalten von Delta-Lake-Tabellen im AWS-Glue-Datenkatalog, indem Sie einfache DDL-Anweisungen wie CREATE EXTERNAL TABLE und DESCRIBE TABLE verwenden, die mit anderen in Athena unterstützten Tabellentypen konsistent sind. Sie können den AWS-Glue-Crawler auch verwenden, um Delta-Lake-Tabellenschemas zu erkennen und Schemaaktualisierungen im Glue-Datenkatalog für Delta-Lake-Dateien zu verwalten, sodass neu katalogisierte Daten nahtlos für die Analyse in Athena verfügbar sind.
Die erweiterte Leseunterstützung für Delta Lake ist in Version 3 der Athena-Engine verfügbar, kann mit den Athena-Treibern, der API oder der Konsole verwendet werden und ist in allen unterstützten Regionen verfügbar. Weitere Informationen zur neuen Delta-Lake-Unterstützung in Athena finden Sie unter Abfragen von Delta-Lake-Tabellen in der Athena-Benutzerdokumentation.