Veröffentlicht am: Nov 17, 2023
Ab heute verwendet Amazon Athena den kostenbasierten Optimierer (CBO), um die Abfrageleistung auf der Grundlage von Tabellen- und Spaltenstatistiken zu verbessern, die vom AWS-Glue-Datenkatalog erfasst wurden. Mit CBO analysiert und wählt Athena Abfrageplanoptimierungen aus, z. B. das Neuordnen von Joins oder das Verschieben von Aggregationen an eine frühere Stelle im Plan, die die Leistung verbessern, ohne dass Änderungen am SQL-Code erforderlich sind.
CBO ist von Vorteil, wenn die Datenmenge im Laufe der Zeit zunimmt oder sich ändert. Beispielsweise produziert ein Einzelhandelsunternehmen mit Hunderten von Geschäften heute wahrscheinlich mehr Daten als zu der Zeit, als es einen Ladenstandort gab. Ein solches Wachstum kann dazu führen, dass Abfragen eine komplexere SQL-Logik oder mehr Verarbeitungszeit als zuvor erfordern. Über CBO wendet Athena datengesteuerte Abfrageplanoptimierungen an, mit denen Änderungen in der Datenstruktur überwunden werden können und zu einer schnelleren Leistung führen können. Verwenden Sie zunächst die Athena- oder Glue-Konsolen oder das AWS SDK, um Tabellenstatistiken für eine ausgewählte Glue-Tabelle zu generieren. Hilfe beim Generieren von Tabellenstatistiken finden Sie unter Generieren von Spaltenstatistiken.
CBO ist in den folgenden AWS-Regionen verfügbar: USA Ost (Nord-Virginia), USA Ost (Ohio), USA West (Oregon), Europa (Irland), Asien-Pazifik (Tokio) und Asien-Pazifik (Osaka). Preisinformationen finden Sie auf der Preisseite von AWS Glue. Weitere Informationen finden Sie im Athena-Benutzerhandbuch unter Verwenden des kostenbasierten Optimierers oder in unserem Blogbeitrag.