Amazon SageMaker Çıkarım için yapışkan oturum yönlendirmesi kullanıma sunuldu

Yayınlanma Tarihi: 12 Eyl 2024

Bugün, müşterilerin daha önce işlenmiş bilgilerinden yararlanarak üretken yapay zeka uygulamalarının performansını ve kullanıcı deneyimini iyileştirmesine yardımcı olan yapışkan oturum yönlendirmenin Amazon SageMaker Çıkarım'da kullanıma sunulduğunu duyuruyoruz. Amazon SageMaker, her türlü kullanım örneği için en iyi fiyat-performans oranıyla çıkarım taleplerinde bulunmak üzere altyapı modelleri (FM'ler) de dahil makine öğrenimi modellerini dağıtmayı kolaylaştırır.

Yapışkan oturumlar etkinleştirildiğinde, aynı oturum için tüm istekler aynı bulut sunucusuna yönlendirilir. Böylece ML uygulamanız, gecikmeyi azaltmak ve kullanıcı deneyimini iyileştirmek için önceden işlenmiş bilgileri yeniden kullanabilir. Bu durum, özellikle müşteriler büyük veri yükleri kullanmak istediğinde veya kesintisiz etkileşimli deneyimlere ihtiyaç duyduğunda değerlidir. Müşteriler, önceki çıkarım isteklerinden yararlanarak SageMaker'da yenilikçi, duruma duyarlı yapay zeka uygulamaları oluşturmak için bu özellikten yararlanabilir. Bunun için, müşterilerin ilk taleplerinde bir oturum kimliği oluşturması ve ardından SageMaker'ın sonraki tüm talepleri aynı bulut sunucusuna yönlendirmesi gerektiğini belirtmek üzere bu oturum kimliğini kullanması gerekir. Yeni oturumlar için kaynakları serbest bırakmak üzere, tamamlanan oturumlar silinebilir.

Bu özellik, SageMaker'ın erişilebildiği tüm bölgelerde kullanılabilir. SageMaker'da model dağıtımı hakkında daha fazla bilgiyi buradan, bu özellik hakkında daha fazla bilgiyi ise belgelerimizden edinebilirsiniz.