Amazon SageMaker HyperPod memperkenalkan peningkatan pada proses debugging skrip siklus hidup.
Amazon SageMaker HyperPod kini menyediakan kemampuan pemecahan masalah yang lebih baik untuk skrip siklus hidup, sehingga memudahkan identifikasi dan penyelesaian masalah selama penyediaan simpul klaster. SageMaker HyperPod membantu Anda menyediakan klaster yang tangguh untuk menjalankan beban kerja AI/ML dan mengembangkan model-model mutakhir seperti model bahasa besar (LLM), model difusi, dan model fondasi (FM).
Saat skrip siklus hidup mengalami masalah selama pembuatan klaster atau operasi simpul, Anda sekarang akan menerima pesan kesalahan terperinci yang mencakup nama grup log CloudWatch dan log stream spesifik tempat Anda dapat menemukan log eksekusi untuk skrip siklus hidup. Anda dapat melihat pesan kesalahan ini dengan menjalankan API DescribeCluster atau dengan melihat halaman detail klaster di konsol SageMaker. Konsol ini juga menyediakan tombol "Lihat log skrip siklus hidup" yang mengarahkan langsung ke log stream CloudWatch yang relevan, sehingga memudahkan pencarian log. Selain itu, log CloudWatch untuk skrip siklus hidup kini menyertakan penanda khusus untuk membantu Anda melacak kemajuan eksekusi skrip siklus hidup, termasuk indikator kapan log skrip siklus hidup dimulai, kapan skrip sedang diunduh, kapan unduhan selesai, dan kapan skrip berhasil atau gagal. Penanda ini membantu Anda dengan cepat mengidentifikasi di mana masalah terjadi selama proses penyediaan. Peningkatan ini mengurangi waktu yang dibutuhkan untuk mendiagnosis dan memperbaiki kegagalan skrip siklus hidup, membantu Anda menjalankan klaster HyperPod Anda lebih cepat.
Fitur ini tersedia di semua AWS Region di mana Amazon SageMaker HyperPod didukung. Untuk mempelajari lebih lanjut, lihat manajemen klaster SageMaker HyperPod di Panduan Pengembang Amazon SageMaker.