Amazon EC2 P5e bulut sunucuları, EC2 Kapasite Blokları aracılığıyla genel kullanıma sunuldu
Bugün AWS, en yeni NVIDIA H200 Tensor Core GPU'larla desteklenen Amazon Elastic Compute Cloud (Amazon EC2) P5e bulut sunucularının genel kullanıma sunulduğunu duyurdu. EC2 Kapasite Blokları aracılığıyla kullanılabilen bu bulut sunucuları, derin öğrenme ve üretici yapay zeka çıkarımı için Amazon EC2'de en yüksek performansı sunar.
Giderek daha karmaşık hâle gelen büyük dil modellerini (LLM'ler) ve en zorlu üretici yapay zeka uygulamalarını destekleyen dağıtım modellerini eğitmek ve dağıtmak için Amazon EC2 P5e bulut sunucularını kullanabilirsiniz. P5e bulut sunucularını farmasötik keşif, sismik analiz, hava durumu tahmini ve finansal modelleme için zorlu HPC uygulamalarını geniş ölçekte dağıtmak amacıyla da kullanabilirsiniz.
P5e bulut sunucuları, P5 bulut sunucularında bulunan H100 GPU'lara kıyasla 1,7 kat daha fazla GPU bellek boyutuna ve 1,5 kat daha fazla GPU bellek bant genişliğine sahip 8 H200 GPU içerir. İkinci nesil Esnek Yapı Bağdaştırıcısı (EFA) teknolojisini kullanarak 3.200 Gbps'ye kadar ağ iletişimi ile dağıtılmış eğitim ve sıkı bir şekilde birleştirilmiş HPC iş yükleri için pazar lideri ölçeklendirme yetenekleri sağlarlar. Müşterilerin büyük ölçekli ihtiyaçlarını düşük gecikmeyle karşılamak için P5e bulut sunucuları, Amazon EC2 UltraClusters'da dağıtılır.
P5e bulut sunucuları ABD Doğu (Ohio) AWS Bölgesinde, ML için EC2 Kapasite Blokları aracılığıyla p5e.48xlarge boyutlarında kullanıma sunuldu.
P5e bulut sunucuları hakkında daha fazla bilgi edinmek için Amazon EC2 P5e Bulut Sunucuları bölümünü inceleyin.