Instans Amazon EC2 P5en, yang dioptimalkan untuk AI dan HPC generatif, umumnya tersedia

Dikirim di: 2 Des 2024

Hari ini, AWS mengumumkan ketersediaan umum instans Amazon Elastic Compute Cloud (Amazon EC2) P5en, yang didukung oleh GPU NVIDIA H200 Tensor Core terbaru. Instans ini memberikan kinerja tertinggi di Amazon EC2 untuk aplikasi deep learning dan komputasi performa tinggi (HPC).

Anda dapat menggunakan instans P5 Amazon EC2 untuk melatih dan melakukan deployment model bahasa besar (LLM) yang semakin kompleks dan model difusi yang mendukung aplikasi AI generatif yang paling menuntut. Anda juga dapat menggunakan instans P5en untuk melakukan deployment aplikasi HPC yang menuntut dalam skala besar dalam penemuan farmasi, analisis seismik, prakiraan cuaca, dan pemodelan keuangan.

Instans P5en dilengkapi 8 GPU H200 yang memiliki ukuran memori GPU 1,7x dan bandwidth memori GPU 1,5x daripada GPU H100 yang ditampilkan dalam instans P5. Instans P5en memasangkan GPU H200 dengan prosesor Intel Xeon Scalable Generasi ke- 4 kustom berperforma tinggi, yang memungkinkan PCIe Gen5 antara CPU dan GPU yang menyediakan hingga 4x bandwidth antara CPU dan GPU serta meningkatkan pelatihan AI dan kinerja inferensi. P5en, dengan maksimum 3200 Gbps dari generasi ketiga EFA menggunakan Nitro v5, menunjukkan peningkatan latensi hingga 35% dibandingkan dengan P5 yang menggunakan generasi EFA dan Nitro sebelumnya. Hal ini membantu meningkatkan performa komunikasi kolektif untuk beban kerja pelatihan terdistribusi seperti deep learning, AI generatif, pemrosesan data waktu nyata, dan aplikasi komputasi performa tinggi (HPC). Untuk memenuhi kebutuhan pelanggan akan skala besar dengan latensi rendah, instans P5en digunakan di Amazon EC2 UltraClusters, dan menyediakan kemampuan scale-out terdepan di pasar untuk pelatihan terdistribusi dan beban kerja HPC yang digabungkan secara ketat.

Instans P5en sekarang tersedia di AWS Region AS Timur (Ohio), AS Barat (Oregon), dan Asia Pasifik (Tokyo) dan Zona Lokal AS Timur (Atlanta) us-east-1-atl-2a dalam ukuran p5en.48xlarge.

Untuk mempelajari lebih lanjut tentang instans P5en, lihat Instans P5 Amazon EC2.