Veröffentlicht am: Sep 30, 2022
Wir freuen uns, ankündigen zu können, dass Amazon SageMaker Model Training jetzt auch SageMaker Training Managed Warm Pools unterstützt. Benutzer können jetzt festlegen, dass ihre Hardware-Instances für das ML-Modelltraining nach Abschluss des Jobs für eine bestimmte Zeit verfügbar bleiben. Mit dieser Funktion können Kunden iterative Experimente durchführen oder aufeinanderfolgende Jobs in großem Umfang für das Modelltraining auf denselben verfügbar gehaltenen Instances ausführen, wobei die Latenzzeit beim Job-Start um das bis zu 8-fache reduziert wird.
Amazon SageMaker Model Training ist eine vollständig verwaltete Funktion, die Instances für jeden Job hochfährt, ein Modell trainiert und dann die Instances nach dem Abschluss herunterfährt. Kunden zahlen nur für die Dauer des Jobs. Diese vollständig verwaltete Funktion bietet Kunden die Freiheit, sich auf ihren ML-Algorithmus zu konzentrieren und sich nicht um das Infrastrukturmanagement kümmern zu müssen, während sie ihre Modelle trainieren. Da jedoch Hardware-Instances für jeden Trainings-Job bereitgestellt werden, führt dieses Verhalten zu einer Startlatenz für sich wiederholende Trainings-Workloads. Da der Prozess des Modelltrainings ein umfangreiches iteratives Experimentieren erfordert, stellt diese Startlatenz für jeden einzelnen Job einen zusätzlichen Aufwand für Kunden dar. Darüber hinaus verwenden Kunden, die große Mengen an Modellen in großem Umfang trainieren möchten, häufig dieselben Instance-Konfigurationen für aufeinanderfolgende Trainingsaufträge und empfinden diese Startlatenz für jeden Job als lästig.
Mit SageMaker Training Managed Warm Pools können Kunden ihre Modelltrainings-Hardware-Instances nach jedem Job für einen bestimmten Zeitraum verfügbar halten. Auf diese Weise können sie das Training mit einer bereits laufenden Instance beginnen, um iterativ zu experimentieren oder eine große Anzahl von Modellen hintereinander zu trainieren. Mit SageMaker Training Managed Warm Pools können Kunden die Startlatenz für einen Modelltrainings-Job um das bis zu 8-fache reduzieren. Kunden können SageMaker Training Managed Warm Pools aktivieren, indem sie in der Trainings-API einen Keep-Alive-Zeitraum angeben. Wenn sie sich für die Nutzung von Warm Pools entscheiden, werden ihnen die Instances und EBS-Volumes für die Dauer des Keep-Alive-Zeitraums in Rechnung gestellt.
SageMaker Training Managed Warm Pools sind in allen öffentlichen AWS-Regionen verfügbar, in denen Amazon SageMaker Model Training verfügbar ist. Um mit der Verwendung zu beginnen, lesen Sie unter Training mit SageMaker Managed Warm Pools im Entwicklerhandbuch von Amazon SageMaker Developer Guide weiter.