SageMaker HyperPod kini mendukung alokasi kuota sumber daya komputasi yang terperinci
Tata kelola tugas SageMaker HyperPod kini mendukung alokasi kuota komputasi terperinci dari GPU, akselerator Trainium, vCPU, dan memori vCPU dalam satu instans. Administrator dapat mengalokasikan kuota komputasi yang terperinci di seluruh tim, mengoptimalkan distribusi sumber daya komputasi dan tetap sesuai anggaran.
Ilmuwan data sering kali menjalankan tugas LLM, seperti pelatihan atau inferensi, yang tidak memerlukan seluruh instans HyperPod, yang menyebabkan kurangnya pemanfaatan sumber daya komputasi yang dipercepat. Tata kelola tugas HyperPod memungkinkan administrator untuk mengelola alokasi kuota komputasi di seluruh tim. Dengan kemampuan ini, administrator sekarang dapat mengalokasikan sumber daya komputasi secara strategis, memastikan akses yang adil, mencegah monopoli sumber daya, dan memaksimalkan pemanfaatan klaster. Kemampuan ini memungkinkan alokasi kuota komputasi berbutir halus selain alokasi tingkat instans, yang selaras dengan tuntutan beban kerja organisasi.
Tata kelola tugas SageMaker HyperPod tersedia di semua AWS Region tempat HyperPod tersedia: AS Timur (Virginia Utara), AS Barat (California Utara), AS Barat (Oregon), Asia Pasifik (Mumbai), Asia Pasifik (Singapura), Asia Pasifik (Sydney), dan Asia Pasifik (Tokyo), Eropa (Frankfurt), Eropa (Irlandia), Eropa (London), Eropa (Stockholm), dan Amerika Selatan (Sao Paulo).
Untuk mempelajari lebih lanjut, kunjungi halaman web SageMaker HyperPod, dan dokumentasi tata kelola tugas HyperPod.