F: Was ist ein elastisches HPC-Cluster?

Ein elastisches Cluster stellt eine HPC-Umgebung bereit, die das gleiche Erscheinungsbild eines herkömmlichen Clusters aufweist, aber den zusätzlichen Vorteil hat, dass sie skalierbar ist: Aufträge werden in eine Warteschlange übermittelt und Knoten werden bei Bedarf aktiviert, Aufträge werden automatisch gestartet, wenn sie inaktiv sind, und Knoten werden automatisch heruntergefahren, wenn sie nicht mehr gebraucht werden.

F: Welche Vorteile bietet die Verwendung von Amazon Web Services für HPC?

AWS ist elastisch. Statt hohe Vorlaufkosten zu zahlen, zahlen Sie nur für das, was Sie auch tatsächlich nutzen. Starten Sie ein Cluster mit 1 000 Kernen nur für einen Tag und Sie zahlen nur für einen Tag. Darüber hinaus ermöglicht ein cloudbasiertes Cluster den permanenten Zugriff auf die neueste Hardware und die Möglichkeit, jedes Cluster an die Anwendung anzupassen, die auf der Hardware ausgeführt wird. Viele AWS HPC-Kunden starten jeden einzelnen Tag Cluster (und deaktivieren sie dann wieder). AWS ist in vielen geografischen Regionen verfügbar. In jeder Region befinden sich mehrere große Availability Zones, die aus einem oder mehreren Rechenzentren bestehen. Dadurch erhalten AWS-Kunden einfachen Zugriff auf praktisch unbegrenzte Datenverarbeitungskapazitäten am Ort ihrer Wahl.

F: Welche Optionen stehen mir zum Ausführen von HPC-Anwendungen in AWS zur Verfügung?

Es gibt viele Open-Source- und gewerbliche HPC-Lösungen, die AWS unterstützen. Viele HPC-Benutzer beginnen mit AWS ParallelCluster und passen die Software an ihre individuellen Anforderungen an. Andere HPC-Benutzer bevorzugen möglicherweise das manuelle Bereitstellen von Instances für die Datenverarbeitung oder das Verwenden ihrer eigenen Skripts, die EC2 APIs über die AWS CLI aufrufen. Einige Benutzer bevorzugen möglicherweise als Ansatz ein vollständig verwaltetes SaaS-Angebot. Alle diese Optionen sind durchführbar und werden von AWS-Kunden verwendet. 

F: Was ist AWS ParallelCluster?

AWS ParallelCluster ist ein Hilfsmittel zum Erstellen und Starten einer AWS CloudFormation-Vorlage. Es handelt sich um eine Python-Anwendung, die AWS-Services wie Amazon EC2, Amazon EBS und Amazon S3 aufruft. Es verwendet außerdem Amazon SQS, Amazon DynamoDB, Amazon CloudWatch und AWS CloudFormation zur Überwachung und Wartung des Clusters. Weitere Informationen finden Sie in der Dokumentation zum AWS ParallelCluster

F: Was sind die Vorteile der Verwendung von AWS ParallelCluster zur Ausführung meiner HPC-Anwendung?

AWS ParallelCluster bietet schnellen Zugriff auf eine Cluster-Umgebung mit einer Vielzahl von Softwareentwicklungstools, einem Freigabedatenträger, einer Auswahl an Planungssoftware sowie Funktionen für die Überwachung von Instances und Ausführungen. AWS ParallelCluster reiht Software, die von mehreren Benutzern gestartet wird, in eine Warteschlange ein. Darüber hinaus sind Umgebungen, die von AWS ParallelCluster gestartet werden, vollständig für das Ausführen von MPI-Anwendungen mithilfe von AWS-erweiterten Netzwerkfunktionen konfiguriert.

F: Was kostet die AWS ParallelCluster-Software?

CfnCluster ist ein kostenloses Open-Source-Tool, das von AWS entwickelt wurde.

F: Wie hoch sind die Kosten für die AWS-Ressourcen in meinem HPC-Cluster?

Nach der Bereitstellung entstehen typische Kosten für die AWS-Infrastruktur, wie z. B. Kosten für die Master-Instance, für Serverknoten, EBS-Volumes und den genutzten Amazon S3-Speicher. Weitere Informationen erhalten Sie unter verwendete Services und Kosten.

F: Was, wenn meine Anwendung unterschiedliche Konfigurationen für die Infrastruktur erfordert? Kann ich mit AWS ParallelCluster einfach experimentieren?

Ja. AWS ParallelCluster eignet sich hervorragend zum Experimentieren. So lässt sich das Cluster anhand Ihrer Bedürfnisse und wachsenden Anforderungen einfach neu konfigurieren. Zudem kann die pcluster-Konfigurationsdatei der Versionskontrolle unterstellt werden, um die Einstellungen für jedes Experiment zu dokumentieren. Auf der Suche nach der besten Leistung oder den geringsten Kosten können mit AWS ParallelCluster verschiedene Aspekte der Cluster-Konfiguration einfach getestet werden, wie z. B. Instance-Typ, Betriebssystem und Speicherkonfigurationen.