Veröffentlicht am: May 1, 2019
Das Amazon EKS Deep Learning Benchmark-Hilfsprogramm ist ein neues automatisiertes Tool zur Durchführung von Machine Learning-Benchmarks auf Kubernetes-Clustern. Das Open Source-Tool wurde vom Amazon Elastic Container Service for Kubernetes (EKS)-Team entwickelt.
Mithilfe der Open Source-Software Kubernetes können Sie Modelle zum Machine Learning für Training und Folgerung in kürzester Zeit skalieren und in der Nähe Ihrer Datenquellen auf AWS ausführen. Bei einer Vielzahl an Variablen und Infrastrukturmöglichkeiten zur Ausführung von Machine Learning-Aufgaben auf Kubernetes sind laufende Benchmarks erforderlich, um die richtige Konfiguration für Ihre Verarbeitungslast zu finden. Bislang waren für die Durchführung von Benchmarks der Machine Learning-Leistung auf Kubernetes mehrere manuelle Schritte für jede Leistungsoptimierung erforderlich, wodurch kostengünstige und leistungsstarke Machine Learning-Aufträge deutlich mehr Zeit und Aufwand in Anspruch nahmen.
Das Amazon EKS Deep Learning Benchmark-Hilfsprogramm vereinfacht die Durchführung von Benchmarks der Leistung Ihres auf AWS ausgeführten Kubernetes Clusters für Deep Learning-Training und andere Machine Learning-Verarbeitungslasten. Das Hilfsprogramm bietet einen automatisierten End-to-End Benchmark-Workflow von der Cluster-Erstellung bis hin zur Cluster-Auflösung und unterstützt umfassend konfigurierbare Cluster-Konfigurationen, unterschiedliche Backend-Speichersysteme sowie mehrere Frameworks, einschließlich Tensorflow, Horovod, OpenMPI, PyTorch und MxNet.
Besuchen Sie für weitere Informationen das Projekt auf GitHub.
Lesen Sie unseren Blog, um mehr über die Optimierung von verteilter Deep Learning-Leistung mit Amazon EKS zu erfahren.