Memperkenalkan pelatihan elastis di Amazon SageMaker HyperPod

Dikirim di: 3 Des 2025

Amazon SageMaker HyperPod kini mendukung pelatihan elastis, memungkinkan organisasi mempercepat pelatihan model foundation dengan melakukan penskalaan otomatis pada beban kerja pelatihan berdasarkan ketersediaan sumber daya dan prioritas beban kerja. Hal ini menandai perubahan mendasar dari pelatihan dengan alokasi sumber daya tetap, karena menghemat berjam-jam waktu rekayasa yang biasanya dihabiskan untuk mengonfigurasi ulang tugas pelatihan mengikuti ketersediaan komputasi.

Sebelumnya, setiap perubahan kapasitas komputasi mengharuskan penghentian pelatihan secara manual, mengubah parameter pelatihan, lalu memulai ulang tugas—proses yang membutuhkan keahlian pelatihan terdistribusi dan membuat akselerator AI yang mahal tidak terpakai selama konfigurasi ulang tugas pelatihan. Pelatihan elastis secara otomatis memperluas tugas pelatihan untuk memanfaatkan akselerator AI yang sedang menganggur dan menyusut secara mulus ketika beban kerja prioritas lebih tinggi membutuhkan sumber daya—semuanya tanpa menghentikan pelatihan.

Dengan menghilangkan overhead konfigurasi ulang manual dan memastikan pemanfaatan komputasi yang terus berlangsung, pelatihan elastis membantu menghemat waktu yang sebelumnya tersita untuk pengelolaan infrastruktur, menekan biaya dengan memaksimalkan utilisasi klaster, dan mempercepat time-to-market. Pelatihan dapat dimulai segera dengan sumber daya minimal dan tumbuh secara oportunistik saat kapasitas tersedia.

SageMaker HyperPod tersedia di semua wilayah di mana Amazon SageMaker HyperPod saat ini tersedia. Organisasi dapat mengaktifkan pelatihan elastis tanpa perubahan kode menggunakan resep HyperPod untuk model yang tersedia untuk umum termasuk Llama dan GPT OSS. Untuk arsitektur model khusus, pelanggan dapat mengintegrasikan kemampuan pelatihan elastis melalui pembaruan konfigurasi ringan dan modifikasi kode minimal, sehingga dapat diakses oleh tim tanpa memerlukan keahlian sistem terdistribusi.

Untuk memulai, kunjungi halaman produk Amazon SageMaker HyperPod dan lihat dokumentasi pelatihan elastis untuk panduan implementasi.