Üretken yapay zeka ve HPC için optimize edilmiş Amazon EC2 P5en bulut sunucuları genel kullanıma sunuldu
Bugün AWS, en yeni NVIDIA H200 Tensor Core GPU'larla desteklenen Amazon Elastic Compute Cloud (Amazon EC2) P5en bulut sunucularının genel kullanıma sunulduğunu duyurdu. Bu bulut sunucuları, derin öğrenme ve yüksek performanslı bilgi işlem (HPC) uygulamaları için Amazon EC2'de en yüksek performansı sunar.
Giderek daha karmaşık hâle gelen büyük dil modellerini (LLM'ler) ve en zorlu üretken yapay zeka uygulamalarını destekleyen dağıtım modellerini eğitmek ve dağıtmak için Amazon EC2 P5en bulut sunucularını kullanabilirsiniz. P5en bulut sunucularını farmasötik keşif, sismik analiz, hava durumu tahmini ve finansal modelleme için zorlu HPC uygulamalarını geniş ölçekte dağıtmak amacıyla da kullanabilirsiniz.
P5en bulut sunucuları, P5 bulut sunucularında bulunan H100 GPU'lara kıyasla 1,7 kat daha fazla GPU bellek boyutuna ve 1,5 kat daha fazla GPU bellek bant genişliğine sahip 8 adede kadar H200 GPU içerir. P5en bulut sunucuları, H200 GPU'ları yüksek performanslı özel 4. Nesil Intel Xeon Ölçeklenebilir işlemcilerle bir araya getirerek CPU ile GPU arasında 4 kata kadar fazla bant genişliği sağlayan ve yapay zeka eğitimi ile çıkarım performansını artıran 5. Nesil PCIe'yi etkinleştirir. Nitro v5 kullanan üçüncü nesil EFA'da 3200 Gb/sn değerine ulaşabilen P5en, önceki nesil EFA ve Nitro'yu kullanan P5'e kıyasla gecikme süresinde %35'e varan iyileşme gösterir. Bu iyileşme, derin öğrenme, üretken yapay zeka, gerçek zamanlı veri işleme ve yüksek performanslı bilgi işlem (HPC) uygulamaları gibi dağıtılmış eğitim iş yükleri için kolektif iletişim performansını artırmaya yardımcı olur. Müşterilerin büyük ölçekli ihtiyaçlarını düşük gecikmeyle karşılamak için P5en bulut sunucuları, Amazon EC2 UltraClusters'da dağıtılmıştır. Ayrıca eğitim ve sıkı bir şekilde bağlanmış HPC iş yükleri için pazar lideri ölçeklendirme özellikleri sağlar.
P5en bulut sunucuları artık ABD Doğu (Ohio), ABD Batı (Oregon) ve Asya Pasifik (Tokyo) AWS bölgelerinde ve ABD Doğu (Atlanta) Yerel Bölgesi'nde (us-east-1-atl-2a) p5en.48xlarge boyutunda kullanılabilir.
P5en bulut sunucuları hakkında daha fazla bilgi edinmek için Amazon EC2 P5en Bulut Sunucuları bölümünü inceleyin.