AWS Batch sekarang mendukung penjadwalan beregu di Amazon EKS menggunakan pekerjaan multi-node paralel
Hari ini, AWS mengumumkan ketersediaan umum pekerjaan Multi-Node Parallel (MNP) di AWS Batch di Amazon Elastic Kubernetes Service (Amazon EKS). Dengan pekerjaan AWS Batch MNP, Anda dapat menjalankan aplikasi Komputasi Performa Tinggi (HPC) yang digabungkan secara ketat seperti melatih model AI/ML multi-layer. AWS Batch membantu Anda meluncurkan, mengonfigurasi, dan mengelola simpul di klaster Amazon EKS tanpa intervensi manual.
Anda dapat mengonfigurasi pekerjaan MNP menggunakan API RegisterJobsDefinition atau melalui bagian definisi pekerjaan di AWS Batch Management Console. Dengan pekerjaan MNP, Anda dapat menjalankan AWS Batch pada beban kerja Amazon EKS yang mencakup beberapa instans Amazon Elastic Compute Cloud (Amazon EC2). Pekerjaan AWS Batch MNP mendukung kerangka komunikasi antar instans berbasis IP, seperti NVIDIA Collective Communications Library (NCCL), Gloo, Message Passing Interface (MPI), atau Unified Collective Communication (UCC) serta machine learning dan pustaka komputasi paralel seperti PyTorch dan Dask. Untuk informasi selengkapnya, lihat halaman pekerjaan Multi-Node Parallel di Panduan Pengguna AWS Batch.
AWS Batch mendukung pengembang, ilmuwan, dan teknisi dalam menjalankan pemrosesan batch yang efisien untuk pelatihan model ML, simulasi, dan analisis pada skala apa pun. Pekerjaan Multi-Node Parallel tersedia di AWS Region mana pun tempat AWS Batch tersedia.