Amazon SageMaker HyperPod kündigt neue Beobachtbarkeits-Funktion an
Die neue Beobachtbarkeits-Funktion von Amazon SageMaker HyperPod ermöglicht es Kunden, die generative KI-Modellentwicklung zu beschleunigen, indem sie einen umfassenden Überblick über Rechenressourcen und Modellentwicklungsaufgaben bietet. Es macht die manuelle Arbeit überflüssig, Hunderte von Metriken aus dem gesamten Stack zu sammeln, die Korrelationen zwischen ihnen zu visualisieren und die Leistung der generativen KI-Modellentwicklung wiederherzustellen. Die HyperPod-Beobachtbarkeitsfunktion sammelt Leistungskennzahlen von Aufgaben in Echtzeit, warnt Kunden bei deren Verschlechterung und behebt automatisch die Ursache nach kundendefinierten Richtlinien.
SageMaker HyperPod-Beobachtbarkeit verändert die Art und Weise, wie Kunden ihre Aufgaben zur generativen KI-Modellentwicklung überwachen und optimieren. Über ein einheitliches Dashboard, das in Amazon Managed Grafana vorkonfiguriert ist und dessen Überwachungsdaten automatisch in einem Amazon Managed Prometheus-Workspace veröffentlicht werden, können Kunden nun generative KI-Leistungskennzahlen, die Ressourcenauslastung und den Cluster-Zustand in einer einzigen Ansicht sehen. Auf diese Weise können Teams Engpässe schnell erkennen, kostspielige Verzögerungen vermeiden und die Rechenressourcen optimieren. Kunden können automatische Benachrichtigungen definieren, Anwendungsfall-spezifische Aufgabenkennzahlen ableiten und diese mit nur wenigen Klicks im einheitlichen Dashboard veröffentlichen. Durch die Verkürzung der Zeit für die Fehlerbehebung von Tagen auf Minuten hilft diese Funktion den Kunden, ihren Weg zur Produktion zu beschleunigen und die Rendite ihrer KI-Investitionen zu maximieren.
SageMaker HyperPod-Beobachtbarkeit ist in allen AWS-Regionen verfügbar, in denen SageMaker HyperPod unterstützt wird, außer USA West (Nordkalifornien) und Asien-Pazifik (Melbourne). Um mehr zu erfahren und loszulegen, besuchen Sie den Blog, die Dokumentation und die SageMaker HyperPod-Webseite.