Amazon SageMaker HyperPod mengumumkan kemampuan observabilitas baru
Kemampuan observabilitas baru Amazon SageMaker HyperPod memungkinkan pelanggan mempercepat pengembangan model AI generatif dengan memberikan visibilitas komprehensif di seluruh sumber daya komputasi dan tugas pengembangan model. Ini menghilangkan pekerjaan manual mengumpulkan ratusan metrik dari seluruh tumpukan, memvisualisasikan korelasi di antara mereka, dan memulihkan kinerja tugas pengembangan model AI generatif. Observabilitas HyperPod melacak metrik kinerja tugas secara real-time, memberi tahu pelanggan ketika salah satu dari metrik tersebut memburuk, dan secara otomatis memperbaiki akar penyebab dengan kebijakan yang ditentukan pelanggan.
Observabilitas SageMaker HyperPod mengubah cara pelanggan memantau dan mengoptimalkan tugas pengembangan model AI generatif mereka. Melalui dasbor terpadu yang telah dikonfigurasi sebelumnya di Amazon Managed Grafana dengan data pemantauan yang dipublikasikan secara otomatis ke ruang kerja Prometheus Kelolaan Amazon, pelanggan sekarang dapat melihat metrik kinerja tugas AI generatif, pemanfaatan sumber daya, dan kondisi klaster dalam satu tampilan. Hal ini memungkinkan tim untuk dengan cepat menemukan hambatan, mencegah penundaan yang mahal, dan mengoptimalkan sumber daya komputasi. Pelanggan dapat menentukan peringatan otomatis, memperoleh metrik tugas khusus kasus penggunaan, dan mempublikasikan ke dasbor terpadu hanya dengan beberapa klik. Dengan mengurangi waktu pemecahan masalah dari hari ke menit, kemampuan ini membantu pelanggan mempercepat jalur produksi mereka dan memaksimalkan pengembalian investasi AI mereka.
Observabilitas SageMaker HyperPod tersedia di semua Wilayah AWS di mana SageMaker HyperPod didukung, kecuali AS Barat (California Utara) dan Asia Pasifik (Melbourne). Untuk mempelajari lebih lanjut dan memulai, kunjungi blog, dokumentasi, dan halaman web SageMaker HyperPod.