Amazon Bedrock, Öncelikli ve Flex çıkarım hizmeti katmanlarını tanıttı
Bugün Amazon Bedrock, farklı yapay zeka iş yükleri için maliyetleri ve performansı optimize etmek için iki yeni çıkarım hizmeti katmanı sunuyor. Yeni Flex katmanı, model değerlendirmeleri ve içerik özetleme gibi zaman açısından kritik olmayan uygulamalar için uygun maliyetli fiyatlandırma sunarken; Öncelikli katman, görev açısından kritik uygulamalara üstün performans ve tercihli işleme sağlar. Öncelik Katmanını destekleyen çoğu model için müşteriler, standart katmana kıyasla %25'e kadar daha iyi çıktı belirteçleri (OTPS) gecikmesi gerçekleştirebilir. Bunlar, güvenilir performansla günlük yapay zeka uygulamaları için mevcut Standart katmanına katılır.
Bu hizmet katmanları kuruluşların büyük ölçekte yapay zeka dağıtırken karşılaştıkları temel zorlukları ele alır. Flex katmanı, daha uzun gecikmeleri tolere edebilen etkileşimli olmayan iş yükleri için tasarlanmıştır. Bu da onu model değerlendirmeleri, içerik özetleme, etiketleme, açıklama ve çok adımlı temsilcili iş akışları için ideal kılar ve standart katmana göre indirimli olarak fiyatlandırılır. Flex istekleri, yüksek talep dönemlerinde Standart katmana göre daha düşük öncelik alır. Öncelikli katman, kritik görev uygulamaları, gerçek zamanlı son kullanıcı etkileşimleri ve tutarlı, hızlı yanıtların gerekli olduğu etkileşimli deneyimler için idealdir. Yüksek talep dönemlerinde, Öncelikli istekler, ek bir ücret karşılığında diğer hizmet katmanlarından öncelikli olabilirler. Bu yeni hizmet katmanları bugün OpenAI (gpt-oss-20b, gpt-oss-120b), DeepSeek (DeepSeek V3.1), Qwen3 (Coder-480B-A35B-Instruct, Coder-30B-A3B-Instruct, 32B yoğun, Qwen3-235B-A22B-2507) ve Amazon Nova (Nova Pro ve Nova Premier) dahil olmak üzere bir dizi önde gelen temel modelinde mevcuttur. Bu yeni seçeneklerle Amazon Bedrock, müşterilerin maliyet verimliliğini performans gereksinimleriyle dengeleme konusunda daha fazla kontrol elde etmelerine yardımcı olarak, yapay zeka iş yüklerini ekonomik bir şekilde ölçeklendirmelerine olanak tanır ve en kritik uygulamaları için optimum kullanıcı deneyimleri sağlar.
Amazon Bedrock Önceliği ve Flex çıkarım hizmeti katmanlarının kullanılabildiği AWS Bölgeleri hakkında daha fazla bilgi için AWS Bölgeleri tablosuna bakın
Haber Blogumuzda ve belgelerimizde hizmet katmanları hakkında daha fazla bilgi edinin.