AWS Parallel Computing Service unterstützt jetzt Slurm 25.11
AWS Parallel Computing Service (AWS PCS) unterstützt jetzt Slurm-Version 25.11 mit Unterstützung für einen Prometheus-kompatiblen OpenMetrics-Endpunkt und führt neue Protokolltypen ein, darunter Scheduler-Auditprotokolle.
Die Version Slurm 25.11 führt eine beschleunigte erneute Platzierung in der Warteschlange ein, mit der Jobs, die von Knotenproblemen betroffen sind, automatisch mit der höchsten Priorität neu geplant werden können, damit sich Ihre Workloads schneller erholen können. Sie können mithilfe Ihrer vorhandenen Monitoring-Tools einen neuen OpenMetrics-Endpunkt für Echtzeiteinblicke in Jobs, Knoten und Planung aktivieren. AWS PCS kann jetzt auch Protokolle des Slurm-Datenbank-Daemon (slurmdbd) und des REST-API-Daemon (slurmrestd) an Amazon CloudWatch Logs, Amazon S3 oder Amazon Data Firehose senden, was dabei hilft, Buchhaltungsprobleme zu diagnostizieren und Fehler bei API-Integrationen zu beheben. Scheduler-Auditprotokolle, die zuvor in Betriebsprotokollen enthalten waren, werden jetzt als dedizierter Protokolltyp bereitgestellt, sodass Sie die Einspeisungs- und Speicherkosten unabhängig kontrollieren können.
AWS PCS ist ein verwalteter Service, der das Ausführen und Skalieren von High Performance Computing (HPC)-Workloads und das Erstellen wissenschaftlicher und technischer Modelle auf AWS mit Slurm erleichtert. Mit AWS PCS können Sie vollständige, elastische Umgebungen erstellen, die Rechen-, Speicher-, Netzwerk- und Visualisierungstools integrieren. AWS PCS vereinfacht den Cluster-Betrieb mit verwalteten Updates und integrierten Observability-Features und trägt so dazu bei, den Wartungsaufwand zu reduzieren. Sie können in einer vertrauten Umgebung arbeiten und sich auf Ihre Forschung und Innovation konzentrieren, anstatt sich um die Infrastruktur zu kümmern.
Diese Funktion ist in allen AWS-Regionen verfügbar, in denen AWS PCS angeboten wird. Für Zielorte der Protokollbereitstellung fallen die Standardgebühren an. Weitere Informationen über AWS PCS finden Sie in der Servicedokumentation.