Veröffentlicht am: Aug 4, 2023
Trainingsaufträge von Amazon SageMaker unterstützen jetzt ml.p5-Instances, die von NVIDIA H100-Chips betrieben werden, die speziell für leistungsstarke ML-Trainingsanwendungen in der Cloud konzipiert sind. Sie können ml.p5-Instances auf SageMaker verwenden, um einige der anspruchsvollsten Modelle zu trainieren. Dazu gehören große Sprachmodelle (LLMs) und Diffusionsmodelle, die die anspruchsvollsten generativen KI-Anwendungen unterstützen. Diese Anwendungen umfassen die Beantwortung von Fragen, Codegenerierung, Video- und Bildgenerierung sowie Spracherkennung.
ml.p5-Instances verfügen derzeit über bis zu 8 der neuesten NVIDIA H100 Tensor Core-GPUs. P5-Instances ergänzen die NVIDIA H100 Tensor Core-GPUs mit einer doppelt so hohen CPU-Leistung, einem doppelt so hohen Systemspeicher und einem vierfach höheren lokalen Speicher im Vergleich zu GPU-basierten Instances der vorherigen Generation. Sie bieten marktführende Scale-Out-Fähigkeiten für verteiltes Training und eng gekoppelte HPC-Workloads mit bis zu 3.200 Gbit/s an Netzwerken mithilfe der Elastic Fabric Adapter (EFA)-Technologie der zweiten Generation.
SageMaker Model Training unterstützt ab heute ml.p5-Instances in den AWS-Regionen USA Ost (Nord-Virginia) und USA West (Oregon) in der Größe ml.p5.48xlarge.
Weitere Informationen zu ml.p5-Instances finden Sie auf der Seite zu P5-Instancen. Melden Sie sich zum Einstieg in die Nutzung von ml.p5-Instances bei der Amazon-SageMaker-Konsole an. Weitere Informationen zu Amazon SageMaker Model Training finden Sie auf unserer Webseite.