Amazon Redshift, Top-K sorguları için önemli bir performans optimizasyonu sunuyor
Amazon Redshift, sonuçları daha hızlı döndürmek için ilgisiz veri bloklarını akıllıca atlayarak Top-K sorgularının (ORDER BY ve LIMIT ifadeleri içeren sorgular) işlenmesini daha da optimize eder ve işlenen veri miktarını önemli ölçüde azaltır. Bu optimizasyon, ORDER BY sütununun minimum/maksimum değerlerine göre okunacak veri bloklarını yeniden sıralar ve verimli şekilde düzenler, bellekte yalnızca en uygun K satırını tutar. ORDER BY sütunu sıralı veya kısmen sıralı olduğunda, Amazon Redshift artık tüm tabloları taramak yerine yalnızca gerekli minimum veri bloklarını işler, böylece gereksiz G/Ç ve işlem yükünü ortadan kaldırır.
Bu geliştirme, özellikle verilerin kalıcı olarak azalan sırada depolandığı (ORDER BY … DESC LIMIT K) ve uygun satırların veri depolama alanının sonuna eklendiği büyük tablolarda Top-K sorgularına önemli fayda sağlar. Yaygın kullanım örnekleri şunlardır:
- Milyonlarca veya milyarlarca işlem arasından en son K siparişi bulma
- Satış kataloğunuzda yer alan yüz binlerce stok tutma birimi (SKU) ve bu ürün SKU'larıyla ilişkili milyonlarca veya milyarlarca satış işlemi arasından en iyi performans gösteren K ürünü veya en düşük performans gösteren K ürünü (azalan sırada Top-K) alma
- Milyarlarca istem arasından bir temel büyük dil modeli (LLM) tarafından çıkarılan en yeni K istemi veya en eski K istemini (azalan sırada Top-K) bulma
Bu yeni optimizasyon sayesinde Top-K sorgularının performansı önemli ölçüde artar. Top-K sorgularına yönelik bu optimizasyon, P199 yama sürümü ile birlikte Amazon Redshift'in kullanılabildiği tüm AWS Bölgelerinde ek ücret olmadan Amazon Redshift üzerinde kullanıma sunulmaktadır. Bu optimizasyon, herhangi bir sorgu yeniden yazımı veya yapılandırma değişikliği gerektirmeden uygun sorgulara otomatik olarak uygulanır.