AWS Parallel Computing Service (PCS) artık Slurm aracılığıyla düğüm yeniden başlatmasını destekliyor
AWS Paralel Bilgi İşlem Hizmeti (PCS) artık bulut sunucusu değiştirmeyi tetiklemeden Slurm komutlarını kullanarak işlem düğümlerini yeniden başlatmanıza olanak tanır. Bu özellik sayesinde, tam düğüm değişimi gerektirmeden önce sorun giderme, kaynak temizleme ve bozulmuş durumlardan kurtarma gibi operasyonel nedenlerle düğümleri yeniden başlatabilirsiniz. Bu, küme sağlığını daha düşük maliyetlerle verimli bir şekilde korumanıza olanak tanır.
Bu özellik, PCS'nin kullanılabildiği tüm AWS bölgelerinde kullanılabilir. Diğer yöntemlerle yeniden başlatmalar ise bulut sunucusu değiştirmeyi tetiklemeye devam ederken anında veya ertelenmiş yeniden başlatmaları planlama seçenekleri için 'scontrol reboot' komutunu kullanabilirsiniz. Daha fazla bilgi edinmek için AWS PCS'de Slurm ile işlem düğümlerini yeniden başlatma bölümüne bakın.
PCS, Slurm kullanarak AWS'de yüksek performanslı bilgi işlem (HPC) iş yüklerini çalıştırmayı ve ölçeklendirmeyi kolaylaştıran yönetilen bir hizmettir. PCS hakkında daha fazla bilgi için hizmet belgelerine bakın.