Amazon SageMaker, müşterilerin maliyetlerden tasarruf etmesine yardımcı olmak üzere yapay zeka çıkarımı için Sıfıra Ölçeklendirme'yi kullanıma sunuyor
Amazon SageMaker Çıkarım'da, uç noktaların etkin olmama dönemlerinde sıfır bulut sunucusuna ölçeklenmesine olanak tanıyan yeni bir özellik olan Sıfıra Ölçeklendirme özelliğini duyurmaktan heyecan duyuyoruz. Bu özellik, yapay zeka modellerini kullanarak çıkarım yapma maliyetlerini önemli ölçüde azaltabilir ve özellikle sohbet robotları, içerik moderasyon sistemleri ve diğer üretken yapay zeka kullanım durumları gibi değişken trafik modellerine sahip uygulamalar için kullanışlı olabilir.
Sıfıra Ölçeklendirme ile müşteriler, SageMaker çıkarım uç noktalarını kullanılmadığında otomatik olarak sıfır bulut sunucusuna ölçeklenecek ve trafik devam ettiğindeyse hızla yeniden ölçeklenecek şekilde yapılandırabilir. Bu özellik, öngörülebilir trafik modellerine, aralıklı çıkarım trafiğine ve geliştirme/test ortamlarına sahip senaryolar için etkilidir. SageMaker Çıkarım Bileşenleri ile Sıfıra Ölçeklendirme uygulamak basittir. Müşteriler otomatik ölçeklendirme politikalarını Python İçin AWS SDK (Boto3), SageMaker Python SDK veya AWS Komut Satırı Arabirimi (AWS CLI) aracılığıyla yapılandırabilir. Süreç, yönetilen bulut sunucusu ölçeklendirmesi etkinleştirilmiş bir uç nokta ayarlamayı, ölçeklendirme politikaları yapılandırmayı ve ölçeklendirme eylemlerini tetiklemek için CloudWatch alarmları oluşturmayı içerir.
Sıfıra Ölçeklendirme artık Amazon SageMaker'ın desteklendiği tüm AWS bölgelerinde genel kullanıma sunulmuştur. Sıfıra Ölçeklendirme'yi uygulama ve üretken yapay zeka dağıtımları için maliyetleri optimize etme hakkında daha fazla bilgi edinmek üzere lütfen belgeler sayfamızı ziyaret edin.