Veröffentlicht am: Dec 1, 2019
Amazon SageMaker Operators for Kubernetes erleichtert Entwicklern und Daten-Wissenschaftlern das Schulen, Optimieren und Bereitstellen von Machine Learning (ML)-Modellen in Amazon SageMaker.
Kunden verwenden Kubernetes, ein universelles Container-Verwaltungssystem, um wiederholbare Pipelines einzurichten und eine bessere Kontrolle und Portabilität über ihre Arbeitslasten zu gewährleisten. Aber wenn ML-Workloads in Kubernetes ausgeführt werden, müssen Kunden auch die zugrunde liegende ML-Infrastruktur verwalten und optimieren, Hochverfügbarkeit und Zuverlässigkeit gewährleisten, ML-Tools bereitstellen, um die Produktivität von Daten-Wissenschaftlern zu steigern, und angemessene Sicherheits- und Regulierungsanforderungen zu erfüllen. Mit Amazon SageMaker Operators for Kubernetes können Kunden SageMaker über die Kubernetes API oder Kubernetes-Tools wie kubectl aufrufen, um ihre ML-Jobs in SageMaker zu erstellen und mit ihnen zu interagieren. Dies gibt Kubernetes-Kunden die Vorteile der Portabilität und Standardisierung von Kubernetes und EKS sowie die Vorteile von vollständig verwalteten ML-Diensten mit Amazon SageMaker.
Kunden können Amazon SageMaker Operators für Modellschulungen, Modellhyperparameter-Optimierungen, Echtzeit-Inferenz und Batch-Inferenz verwenden. Für Modellschulungen können Kubernetes-Kunden nun alle Vorteile eines vollständig verwalteten ML-Modellschulungen in SageMaker nutzen, einschließlich Managed Spot Training, um bis zu 90% der Kosten zu sparen, sowie alle Vorteile verteilter Schulungen nutzen, um die Schulungszeit durch Skalierung auf mehrere GPU-Knoten zu verkürzen. Rechenressourcen werden nur bei Bedarf bereitgestellt, nach Bedarf skaliert und automatisch heruntergefahren, wenn Aufgaben abgeschlossen sind, was eine nahezu 100%ige Auslastung gewährleistet. Für das Hyperparametertuning können Kunden das automatische Modell-Tuning von SageMaker nutzen, was den Daten-Wissenschaftlern Tage oder sogar Wochen Zeit spart und die Modellgenauigkeit verbessert. Kunden können die Spot-Instanz auch für die automatische Modelloptimierung nutzen. Für die Inferenz können Kunden mit SageMaker Operators geschulte Modelle in SageMaker bereitstellen, um vollständig verwaltete Auto Scaling-Cluster zu erstellen, die über mehrere Availability Zones verteilt sind, um eine hohe Leistung und Verfügbarkeit für Echtzeit- oder Batch-Vorhersagen zu liefern.
Amazon SageMaker Operators for Kubernetes sind ab diesem Zeitpunkt in den USA Ost (Ohio), USA Ost (Nord-Virginia), USA West (Oregon) und EU (Irland) verfügbar. Sie können mit Schritt-für-Schritt-Anleitungen in unserem Benutzerhandbuch und GitHub Repository beginnen.