يقوم Amazon SageMaker Catalog الآن بتصدير البيانات الوصفية للأصول كمجموعة بيانات قابلة للاستعلام
يقوم Amazon SageMaker Catalog الآن بتصدير البيانات الوصفية للأصول كجدول Apache Iceberg عبر جداول Amazon S3. يتيح هذا لفرق البيانات الاستعلام عن مخزون الكتالوج والإجابة على أسئلة مثل، "كم عدد الأصول التي تم تسجيلها الشهر الماضي؟"، "ما هي الأصول المصنفة على أنها سرية؟"، أو "ما هي الأصول التي تفتقر إلى الأوصاف التجارية؟" باستخدام لغة SQL القياسية دون بناء بنية تحتية مخصصة لاستخراج وتحويل وتحميل (ETL) لإعداد التقارير.
تحول هذه الإمكانية تلقائيًا البيانات الوصفية لأصول الكتالوج إلى جدول قابل للاستعلام يمكن الوصول إليه من Amazon Athena، ومفكرات استوديو SageMaker الموحد، ووكلاء الذكاء الاصطناعي، وأدوات التحليلات وذكاء الأعمال (BI) الأخرى. يتضمن الجدول المُصدَّر بيانات وصفية تقنية (مثل resource_id, resource_type)، وبيانات وصفية تجارية (مثل asset_name, business_description)، وتفاصيل الملكية، والطوابع الزمنية. يتم تقسيم البيانات حسب تاريخ اللقطة (snapshot_date) لاستعلامات السفر عبر الزمن وتظهر تلقائيًا في استوديو SageMaker الموحد ضمن حزمة aws-sagemaker-catalog.
هذه الإمكانية متاحة في جميع مناطق AWS التي يتم فيها دعم SageMaker Catalog دون أي رسوم إضافية. أنت تدفع فقط مقابل الخدمات الأساسية بما في ذلك تخزين جداول S3 واستعلامات Amazon Athena. يمكنك التحكم في تكاليف التخزين عن طريق تعيين سياسات الاحتفاظ على الجداول المُصدَّرة لإزالة السجلات الأقدم من الفترة المحددة تلقائيًا.
للبدء، قم بتنشيط تصدير مجموعة البيانات باستخدام AWS CLI، ثم قم بالوصول إلى جدول الأصول من خلال جداول S3 أو علامة التبويب "البيانات" في استوديو SageMaker الموحد في غضون 24 ساعة. يمكنك الاستعلام باستخدام Amazon Athena، أو مفكرات Studio، أو قم بتوصيل أدوات ذكاء الأعمال الخارجية من خلال نقطة نهاية كتالوج Iceberg REST لجداول S3. للحصول على الإرشادات، راجع دليل المستخدم لـ Amazon SageMaker.