Veröffentlicht am: Jun 8, 2023
Mit Amazon Athena für Apache Spark können Sie jetzt Ihre eigenen Java-Bibliotheken verwenden und die Spark-Konfigurationen für Ihre Spark-Workloads anpassen. Sie können Java-Bibliotheken als benutzerdefinierte JARs mit Athena Spark verwenden, um Daten aus mehreren Quellen zu analysieren, oder Funktionen in benutzerdefinierten JARs verwenden, um mehr Flexibilität bei Berechnungen zu erzielen.
Amazon Athena für Apache Spark ist ein Feature von Amazon Athena, mit der Sie interaktive Analysen in Apache Spark in weniger als einer Sekunde ausführen können, um Petabyte an Daten zu analysieren. Sie können jetzt Ihre eigenen Java-Bibliotheken und -Module (als JAR-Dateien) in Spark-Workloads einbinden, um eine Verbindung zu verschiedenen Datenquellen herzustellen und mithilfe benutzerdefinierter Funktionen erweiterte Berechnungen durchzuführen, um die Feature-Erkundung durchzuführen. Darüber hinaus können Sie in Athena auch Spark-Konfigurationen für Ihre Sitzungen einrichten, z. B. um benutzerdefinierte Einstellungen bereitzustellen, die für Ihre Java-Pakete erforderlich sind, oder um kontenübergreifend auf AWS-Glue-Kataloge zuzugreifen, um Data-Mesh-ähnliche Designmuster zu unterstützen. Diese Markteinführung umfasst eine Reihe von Referenzkonnektorpaketen für Amazon CloudWatch Logs, CloudWatch-Metriken und Amazon DynamoDB, sodass Sie Daten aus den Services in Ihren Erkenntnissen verwenden können.
Unterstützung für benutzerdefinierte Java-Bibliotheken und für benutzerdefinierte Spark-Konfigurationen ist in den folgenden 9 AWS-Regionen verfügbar, in denen Amazon Athena für Apache Spark verfügbar ist: USA Ost (Ohio), USA Ost (Nord-Virginia), USA West (Oregon), Europa (Irland), Europa (Frankfurt), Asien-Pazifik (Tokio), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney) und Asien-Pazifik (Mumbai). Weitere Informationen und erste Schritte finden Sie auf der Dokumentationsseite zu Amazon Athena für Apache Spark.