Amazon SageMaker Kataloğu artık varlık meta verilerini sorgulanabilir veri kümesi olarak dışa aktarır
Amazon SageMaker Kataloğu artık varlık meta verilerini Amazon S3 Tabloları aracılığıyla Apache Iceberg tablosu olarak dışa aktarıyor. Bu, veri ekiplerinin katalog envanterini sorgulamasına ve "Geçen ay kaç tane varlık kaydedildi?", "Hangi varlıklar gizli olarak sınıflandırılır?" veya "Hangi varlıkların iş tanımları eksik?" gibi soruları raporlama için özel ETL altyapıları oluşturmadan standart SQL ile yanıtlamalarına olanak tanır.
Bu özellik, katalog varlık meta verilerini otomatik olarak Amazon Athena, SageMaker Birleşik Stüdyosu not defterlerinden, yapay zeka temsilcilerinden ve diğer analiz ve iş zekası araçlarından erişilebilen sorgulanabilir bir tabloya dönüştürür. Dışa aktarılan tablo teknik meta verileri (resource_id, resource_type gibi), işletme meta verileri (asset_name, business_description gibi), sahiplik ayrıntıları ve zaman damgalarını içerir. Veriler, zaman yolculuğu sorguları için snapshot_date ile bölümlenir ve otomatik olarak SageMaker Birleşik Stüdyosu'nda aws-sagemaker-catalog bucket'ının altında görünür.
Bu özellik, SageMaker Kataloğu'nun desteklendiği tüm AWS Bölgelerinde ek ücret ödemeden kullanılabilir. Yalnızca S3 Tabloları depolama alanı ve Amazon Athena sorguları dahil olmak üzere temel hizmetler için ödeme yaparsınız. Belirtilen süreden daha eski kayıtları otomatik olarak kaldırmak için dışa aktarılan tablolarda saklama politikaları ayarlayarak depolama maliyetlerini kontrol edebilirsiniz.
Başlamak için AWS CLI'yi kullanarak veri kümesi dışa aktarmayı etkinleştirin, ardından S3 Tabloları veya SageMaker Birleşik Stüdyosu'nun veri sekmesinden 24 saat içinde varlık tablosuna erişin. Amazon Athena ve Stüydo not defterlerini kullanarak sorgulama yapın veya harici BI araçlarını S3 Tabloları Iceberg REST Kataloğu uç noktası üzerinden bağlayın. Talimatlar için Amazon SageMaker kullanım kılavuzuna bakın.