Referenzbereitstellung

IBM InfoSphere DataStage auf AWS

Hochskalierbare Datenintegrationslösung zum Verschieben und Transformieren von Daten

Bei diesem Quick Start wird IBM InfoSphere DataStage auf einem Red Hat OpenShift Container Platform-Cluster automatisch in ca. zwei Stunden in einer neuen oder bestehenden Virtual Private Cloud (VPC) in der Amazon Web Services-Cloud (AWS) bereitgestellt.  

Mit IBM InfoSphere DataStage können Nutzer auf Daten für Geschäftsanforderungen zugreifen, mehrere Datenquellen und -ziele anschließen sowie große Datenmengen integrieren und umwandeln, um Daten auf Erkenntnisse vorzubereiten.

Die wichtigsten Vorteile der Bereitstellung von IBM InfoSphere DataStage auf AWS umfassen u. a.:

  • Skalierbarkeit in einer containerisierten, hochverfügbaren Architektur.
  • Breites Spektrum von Transformationen für einfache und komplexe Integrationsaufgaben.
  • Hohe Leistung durch Rahmenbedingungen zur Parallelverarbeitung auf Unternehmensebene.

Dieser Quick Start enthält AWS CloudFormation-Vorlagen zur Automatisierung der Bereitstellung.

IBM-Logo

Diese Quick-Start-Version wurde von IBM in Zusammenarbeit mit AWS entwickelt. IBM ist ein Partner von APN.

  •  Ihre Möglichkeiten
  •  Bereitstellungsanleitung
  •  Kosten und Lizenzen
  •  Ihre Möglichkeiten
  • Mit diesem Quick Start können Sie die folgende Umgebung in AWS automatisch einrichten:

    • Eine hochverfügbare Architektur, die sich über drei Availability Zones erstreckt.*
    • Eine VPC, die mit öffentlichen und privaten Subnetzen gemäß den bewährten Methoden von AWS konfiguriert ist, um Ihnen Ihr eigenes virtuelles Netzwerk auf AWS zu bieten.*
    • In den öffentlichen Subnetzen:
      • Verwaltete Network Address Translation (NAT)-Gateways, die den ausgehenden Internetzugriff für Ressourcen in den privaten Subnetzen ermöglichen.*
      • Eine Linux Ansible config-Server Amazon Elastic Compute Cloud (Amazon EC2)-Instance, die auch als Bastion-Host agiert, um eingehenden Secure Shell (SSH)-Zugriff auf EC2-Instances in privaten Subnetzen ermöglicht.*
      • Eine EC2-Instance (Microsoft Windows Server 2012 R2), auf der ein Thick-Client von InfoSphere DataStage ausgeführt wird. Eingehende SSH-zu-EC2-Instances in den öffentlichen und privaten Subnetzen sind von dieser Instance aus auch mit PuTTY möglich.
    • In den privaten Subnetzen:
      • Drei OpenShift Containerplattform Master-Instances in einer Auto Scaling-Gruppe.
      • Drei OpenShift Containerplattform etcd-Instances in einer Auto Scaling-Gruppe.
      • Drei OpenShift Containerplattform GlusterFS-Instances in einer Auto Scaling-Gruppe, die verschlüsselte Amazon Elastic Block Storage (Amazon EBS)-Volumes benutzen.
      • Zwei Arbeiterknoten in einer Auto Scaling-Gruppe, die InfoSphere DataStage Engine, Services und Metadaten-Repository-Stufen enthält. 
    • Ein Classic Load Balancer, der die öffentlichen Subnetze für den Zugriff auf DataStage von einem Webbrowser und von DataStage Client-Instances umfasst.
    • Ein Classic Load Balancer, der die öffentlichen Subnetze für den Zugriff auf OpenShift Containerplattform-Instances umfasst.
    • Ein Network Load Balancer, der die privaten Subnetze zum Weiterleiten von internem OpenShift API-Verkehr zu den OpenShift Containerplattform-Masterknoten umfasst.
    • Eine private gehostete Amazon Route 53-Zone zum Lösen von internen Domain Name System (DNS)-Abfragen.

    * Die Vorlage, die den Quick Start in einer bestehenden VPC einrichtet, sorgt dafür, dass die mit Sternchen gekennzeichneten Vorgänge übersprungen werden, und fordert Sie zur Eingabe Ihrer bestehenden VPC-Konfiguration auf. 

  •  Bereitstellungsanleitung
  • Zur Einrichtung von IBM InfoSphere DataStage auf AWS befolgen Sie die Anweisungen in der Einrichtungsanleitung. Der Einrichtungsprozess umfasst folgende Schritte:

    1. Wenn Sie noch kein AWS-Konto haben, registrieren Sie sich bitte unter https://aws.amazon.com und melden sich dann an.
    2. Informationen zu IBM InfoSphere DataStage und Red Hat-Lizenzen abrufen. Kaufen Sie Lizenzen von Passport Advantage oder Ihrem IBM-Vertreter.
    3. Starten Sie den Quick Start. Jede Bereitstellung dauert etwa 2 Stunden. Hierbei können zwischen den folgenden beiden Optionen wählen:
    4. Testen Sie die Bereitstellung. Sie können auf InfoSphere DataStage über das IBM InfoSphere Information Server Launchpad zugreifen.
  •  Kosten und Lizenzen
  • Die Kosten der zur Ausführung dieser Quick-Start-Referenzinstallation erforderlichen AWS-Dienste sind allein von Ihnen zu tragen. Durch die Verwendung des Quick Start entstehen keine zusätzlichen Kosten.

    Die in der AWS CloudFormation-Vorlage enthaltenen Konfigurationsparameter für diesen Quick Start können individuell angepasst werden. Einige dieser Parameter, beispielsweise der Instance-Typ, wirken sich auf die Bereitstellungskosten aus. Kostenkalkulationen finden Sie auf den Seiten mit den Preisen für die von Ihnen genutzten AWS-Services. Preisänderungen sind vorbehalten.

    Tipp:  Nachdem Sie den Quick Start bereitgestellt haben, empfehlen wir Ihnen, den AWS-Kosten- und -Nutzungsbericht zu aktivieren, um die mit dem Quick Start verbundenen Kosten zu verfolgen. Dieser Bericht liefert Kennzahlen zur Abrechnung eines Amazon Simple Storage Service (Amazon S3) Bucket in Ihrem Konto. Er bietet Ihnen auch Kostenschätzungen auf Grundlage Ihrer aktuellen Nutzung und schließt die Daten am Ende des Monats ab. Weitere Informationen zum Bericht erhalten Sie in der AWS-Dokumentation.

    Für diesen Quick Start ist ein Red Hat-Abonnement Voraussetzung. Auch vorausgesetzt sind Lizenzen für:

    • IBM InfoSphere DataStage
    • IBM InfoSphere DataStage und QualityStage Designer

    Sie können Lizenzen bei Passport Advantage oder einem IBM-Vertreter erwerben. Für Unterstützung bei Passport Advantage siehe Passport Advantage Online für Kunden oder eCustomer Care-Webseiten.