Neden Amazon SageMaker Özellik Deposu tercih edilmelidir?
Amazon SageMaker Özellik Deposu, makine öğrenimi (ML) modelleri için özellik depolamak, paylaşmak ve yönetmek üzere tasarlanmış tam olarak yönetilen bir depodur. Özellikler, eğitim ve çıkarım sırasında kullanılan makine öğrenimi modellerinin girdileridir. Örneğin, müzik çalma listesi öneren bir uygulamada özellikler şarkı derecelendirmelerini, dinleme süresini ve dinleyici demografisini içerebilir. Özellikler birden fazla ekip tarafından tekrar tekrar kullanılır ve özellik kalitesi, son derece doğru bir model sağlamak için kritik öneme sahiptir. Ayrıca, modelleri çevrimdışı olarak toplu halde eğitmek için kullanılan özellikler gerçek zamanlı çıkarım için kullanıma sunulduğunda bu iki özellik deposunu senkronize tutmak zor olabilir. SageMaker Özellik Deposu, makine öğrenimi yaşam döngüsü boyunca özellikleri ölçekli bir şekilde işlemek, standartlaştırmak ve kullanmak için güvenli ve birleşik bir depo sağlar.
Nasıl çalışır?

SageMaker Özellik Deposu'nun Avantajları
Özellik Yönetimi
Özellik işleme ve alma
Amazon S3, Amazon Redshift, AWS Lake Formation, Snowflake ve Databricks Delta Lake gibi farklı kaynaklardan gelen uygulama ve hizmet günlükleri, tıklama akışları, sensörler ve tablo verileri gibi pek çok veri türünü SageMaker Özellik Deposu'na alabilirsiniz. Özellik işleme kullanarak, toplu veri kaynağınızı ve özellik dönüşüm fonksiyonunu (örneğin ürün görüntülemelerinin sayısı veya zaman penceresi toplamları) belirtebilirsiniz ve SageMaker Özellik Deposu, alım sırasında verileri ML özelliklerine dönüştürür. Amazon SageMaker Data Wrangler ile özellikleri doğrudan SageMaker Özellik Deposu'nda yayımlayabilirsiniz. Apache Spark bağlayıcısı ile yüksek hacimli verileri tek bir kod yardımıyla toplu olarak alabilirsiniz.

Özellik depolama, katalog, arama ve yeniden kullanım
SageMaker Özellik Deposu, Amazon SageMaker Stüdyosu'ndaki görsel arabirimden kolayca bulunabilmesi için özellik gruplarını etiketler ve dizine ekler. Özellik kataloğuna göz atmak, ekiplerin güvenle yeniden kullanabilecekleri mevcut özellikleri keşfetmelerini ve işlem hatlarının tekrarlanmasını önlemelerini sağlar. SageMaker Özellik Deposu, varsayılan olarak AWS Glue Veri Kataloğu'nu kullanır ancak isterseniz farklı bir katalog kullanmanıza izin verir. Ayrıca Amazon Athena veya seçtiğiniz başka bir sorgu aracıyla tanıdık SQL kullanarak özellikleri sorgulayabilirsiniz.

Özellik tutarlılığı
SageMaker Özellik Mağazası, eğitim için çevrimdışı depolamayı ve gerçek zamanlı çıkarım için çevrimiçi depolamayı destekler. Eğitim ve çıkarım, birbirlerinden çok farklı kullanım alanlarıdır ve her birinin depolama gereksinimleri farklıdır. Eğitim sırasında modeller genellikle tüm veri setini kullanır ve tamamlanması saatler sürebilirken, çıkarımın milisaniyeler içinde gerçekleşmesi gerekir ve genellikle verilerin bir alt kümesini kullanır. SageMaker Özellik Mağazası, birlikte kullanıldığında çevrimdışı ve çevrimiçi veri kümelerinin eşitlenmiş kalmasını sağlar; bu çok önemlidir, çünkü sapma durumunda model doğruluğunu olumsuz etkileyebilir.

Zaman yolculuğu
Veri bilimcilerin, tanıdan önceki hasta tıbbi verileri gibi o zamanın ötesindeki verileri dahil etme riski olmadan (özellik sızıntısı olarak da adlandırılır) geçmişte belirli bir zamandaki tam özellik değerleri kümesiyle modelleri eğitmesi gerekebilir. SageMaker Özellik Deposu Çevrimdışı API, her bir özelliğin ilgilenilen tarihsel zamandaki durumunu almak için zaman içinde nokta sorgularını destekler.

Güvenlik ve Yönetim
Geçmiş takibi
Özelliklerin güvenle yeniden kullanılmasını sağlamak için veri bilimcilerin özelliklerin nasıl oluşturulduğunu, hangi modellerin ve uç noktaların bunları kullandığını bilmesi gerekir. SageMaker Özellik Deposu, veri bilimcilerin Amazon SageMaker Stüdyo'da SageMaker Lineage kullanarak bunların özelliklerini izlemelerine olanak tanır. SageMaker Lineage zamanlanmış işlem hattı yürütme süreçlerini izlemenize, özellikleri veri kaynaklarına kadar takip etmek için yukarı akış silsilesini görselleştirmenize ve özellik işleme kodunu görüntülemenize, hem de bunların tamamını tek bir ortamda yapmanıza olanak tanır.

ML operasyonları
Özellik mağazaları MLOps yaşam döngüsünün önemli bir bileşenidir. Veri kümelerini ve özellik işlem hatlarını yöneterek veri bilimi görevlerini hızlandırıp, aynı özellikleri birden çok kez oluşturmanın getirdiği yinelenen işleri ortadan kaldırır. SageMaker Özellik Mağazası, bağımsız bir hizmet olarak veya diğer SageMaker hizmetleriyle birlikte MLOps yaşam döngüsü boyunca entegre bir şekilde kullanılabilir.
Güvenlik ve uygunluk
Güvenlik ve uygunluk ihtiyaçlarını desteklemek için, paylaşılan makine öğrenimi özelliklerine nasıl erişileceği konusunda ayrıntılı denetime ihtiyacınız olabilir. Bu ihtiyaçlar genellikle tablo ve sütun düzeyinde erişim denetiminin ötesine geçerek tek tek satır düzeyinde erişim denetimine kadar uzanır. Örneğin, hesap temsilcilerinin bir satış tablosundan yalnızca kendi hesaplarına ait satırları görmesine izin vermek ve kredi kartı numaraları gibi hassas verilerin ön ekini maskelemek isteyebilirsiniz. SageMaker Özellik Deposu, AWS Lake Formation ile birlikte özellik deposu verilerini korumak ve role göre erişim vermek adına ayrıntılı erişim denetimleri uygulamak için kullanılabilir.

Müşteriler
Müşterilerin makine öğrenimi özellikleri için nasıl tam olarak yönetilen bir hizmet kullandıklarını görün
SageMaker Özellik Deposu için kaynaklar
Yenilikler
Total results: 11
- Tarih (En Yeniden En Eskiye)
-
05.01.2024
-
23.10.2023
-
04.10.2023
-
24.07.2023
-
30.06.2023