Instans Amazon EC2 P5e umumnya tersedia melalui Blok Kapasitas EC2
Hari ini, AWS mengumumkan ketersediaan umum instans P5e Amazon Elastic Compute Cloud (Amazon EC2), didukung oleh GPU NVIDIA H200 Tensor Core terbaru. Tersedia melalui Blok Kapasitas EC2, instans ini memberikan kinerja tertinggi di Amazon EC2 untuk inferensi deep learning dan AI generatif.
Anda dapat menggunakan instans P5 Amazon EC2 untuk melatih dan melakukan deployment model bahasa besar (LLM) yang semakin kompleks dan model difusi yang mendukung aplikasi AI generatif yang paling rumit. Anda juga dapat menggunakan instans P5e untuk melakukan deployment aplikasi HPC skala besar, seperti penemuan farmasi, analisis seismik, prakiraan cuaca, dan pemodelan keuangan.
Instans P5e menampilkan 8 GPU H200 yang memiliki ukuran memori GPU 1,7x dan bandwidth memori GPU 1,5x daripada GPU H100 yang ditampilkan dalam instans P5. Instans ini menawarkan kemampuan penskalaan paling unggul di pasar untuk pelatihan terdistribusi dan beban kerja HPC yang terhubung erat, dengan kecepatan jaringan hingga 3.200 Gbps menggunakan teknologi Elastic Fabric Adapter (EFA) generasi kedua. Untuk memenuhi kebutuhan pelanggan akan skala besar dengan latensi rendah, instans P5e digunakan di Amazon EC2 UltraClusters.
Instans P5e sekarang tersedia di AWS Region AS Timur (Ohio) dalam ukuran p5e.48xlarge melalui Blok Kapasitas EC2 untuk ML.
Untuk mempelajari lebih lanjut tentang instans P5e, lihat Instans P5 Amazon EC2.