Referenzbereitstellung

Databricks auf AWS

Stellt einen kollaborativen Workspace für Datenwissenschaft, Machine Learning und Analytik bereit.

Diese Partnerlösung ist für IT-Infrastrukturarchitekten, Administratoren und DevOps-Experten, die die Databricks-API für die Erstellung von Databricks-Workspaces in der Amazon Web Services (AWS)-Cloud verwenden möchten. Diese Partnerlösung erstellt einen neuen Workspace in Ihrem AWS-Konto und richtet die Umgebung für die zukünftige Bereitstellung zusätzlicher Workspaces ein.

Databricks ist eine vereinheitlichte Datenanalytik-Plattform für Daten-Engineering, Machine Learning und kollaborative Datenwissenschaft. Ein Databricks-Workspace ist eine Software-as-a-Service (SaaS)-Umgebung für den Zugriff auf alle Ihre Databricks-Komponenten. Der Workspace organisiert Objekte (z. B. Notebooks, Bibliotheken und Experimente) in Ordnern und liefert Zugriff auf Daten und Rechenressourcen wie Cluster und Aufträge.

Wichtig: Diese AWS-Partner-Solution-Bereitstellung erfordert, dass Ihr Databricks-Konto auf der selben E2-Version der Plattform ist. Kontaktieren Sie Databricks für weitere Informationen.
Ähnliche Inhalte anzeigen

Diese Partnerlösung wurde von Databricks in Zusammenarbeit mit AWS erstellt. Databricks ist ein AWS-Partner.

  •  Was Sie bauen werden
  • Mit dieser Partnerlösung können Sie die folgenden Komponenten einrichten, die den Databricks-Workspace bilden:

    • Eine hochverfügbare Architektur, die mindestens drei Availability Zones umfasst.
    • Eine von Databricks verwaltete oder kundenverwaltete Virtual Private Cloud (VPC) im AWS-Konto des Kunden. Diese VPC ist mit öffentlichen und privaten Subnetzen gemäß den bewährten Methoden von AWS konfiguriert, um Ihnen Ihr eigenes virtuelles Netzwerk auf AWS zu bieten.
    • In den privaten Subnetzen:
      • Databricks-Cluster von Amazon-Elastic-Compute-Cloud-Instances (Amazon EC2).
      • Eine oder mehrere Sicherheitsgruppen, um eine sichere Verbindung mit Cluster zu ermöglichen.
    • In den öffentlichen Subnetzen:
      • Ein Network-Address-Translation-Gateway (NAT) für den ausgehenden Internetzugriff.
    • Amazon CloudWatch für die Databricks-Workspace-Instance-Protokolle.
    • (Optional) Ein kundenverwalteter AWS Key Management Service (AWS KMS)-Schlüssel zur Verschlüsselung von Notebooks.
    • Ein Amazon Simple Storage Service (Amazon S3)-Bucket zur Speicherung von Objekten wie Cluster-Protokolle, Notebook-Revisionen und Auftragsergebnisse.
    • AWS Security Token Service (AWS-STS), um die Anforderung von vorübergehenden Anmeldeinformationen mit eingeschränkten Rechten zur Benutzerauthentifizierung zu ermöglichen.
    • Ein VPC-Endpunkt für den Zugriff auf S3-Artefakte und -Protokolle.
    • Eine kontoübergreifende AWS-Identity-und-Access-Management-Rolle (IAM), die es Databricks ermöglicht, Cluster in der VPC für den neuen Workspace bereitzustellen. Abhängig von der augewählten Bereitstellungsoption, können Sie entweder diese IAM-Rolle während der Bereitstellung erstellen oder eine bestehende IAM-Rolle verwenden.
  •  Bereitstellungsanleitung
  • Zur Bereitstellung von Databricks befolgen Sie bitte die Anweisungen in dem Bereitstellungsleitfaden. Databricks benötigt den Zugriff auf eine kontoübergreifende IAM-Rolle in Ihrem AWS-Konto, um Cluster in der VPC des neuen Workspaces starten zu können. Der Bereitstellungsprozess, der etwa 15 Minuten dauert, umfasst die folgenden Schritte:

    1. Wenn Sie noch kein AWS-Konto haben, registrieren Sie sich unter https://aws.amazon.com und melden Sie sich bei Ihrem Konto an.
    2. Starten Sie die Partnerlösung und wählen Sie aus den folgenden Optionen:

    Amazon kann Informationen zur Benutzerbereitstellung an den AWS-Partner weitergeben, der mit AWS an dieser Lösung zusammengearbeitet hat.  

  •  Kosten und Lizenzen
  • Sie sind für die Kosten der AWS-Services verantwortlich, die während des Betriebs dieser Partnerlösung benutzt werden. Die Verwendung dieser Partnerlösung ist mit keinen zusätzlichen Kosten verbunden.

    Die AWS-CloudFormation-Vorlage für diese Partnerlösung enthält Konfigurationsparameter, die Sie anpassen können. Einige der Einstellungen, wie z. B. der Instance-Typ, wirken sich auf die Kosten der Bereitstellung aus. Kostenvoranschläge finden Sie auf den Preisseiten der einzelnen AWS-Services, die Sie nutzen. Preisänderungen sind vorbehalten.

    Tipp: Nachdem Sie die Partnerlösung bereitgestellt haben, aktivieren Sie den AWS-Kosten- und Nutzungsbericht, um Abrechnungsmetriken an einen Amazon-S3-Bucket in Ihrem Konto zu liefern. Er liefert Kostenschätzungen auf der Grundlage der Nutzung während jedes Monats und aggregiert die Daten am Ende des Monats. Weitere Informationen finden Sie unter  Was sind AWS-Kosten- und Nutzungsberichte?

    Databricks-Kostenschätzungen finden Sie auf der Preisseite von Databricks für Produktkontigente und -funktionen.

Partner-Erfolgsgeschichten
Databricks vereinfacht die Bereitstellung mit AWS-Partnerlösung

Als Databricks vor der Anforderung stand, komplexe Konfigurationsschritte und die Zeit bis zur Bereitstellung von Databricks-Workspaces in der AWS Cloud zu reduzieren, arbeitete das Unternehmen mit dem AWS-Integrations- und Automatisierungsteam zusammen, um eine AWS-Partnerlösung zu entwickeln. Dabei handelt es sich um eine automatisierte Referenzarchitektur, die auf AWS-CloudFormation-Vorlagen mit integrierten bewährten Methoden basiert. 

Lesen Sie die vollständige Partnerreferenz
Zurück zum Seitenanfang