แค็ตตาล็อก Amazon SageMaker ส่งออกข้อมูลเมตาของสินทรัพย์เป็นชุดข้อมูลที่สามารถคิวรีได้แล้ว

โพสต์บน: 2 ธ.ค. 2025

แค็ตตาล็อก Amazon SageMaker ส่งออกข้อมูลเมตาของสินทรัพย์เป็นตาราง Apache Iceberg ผ่านตาราง Amazon S3 ได้แล้ว ซึ่งจะช่วยให้ทีมข้อมูลสามารถคิวรีคลังสินค้าของแค็ตตาล็อกและตอบคำถามเช่น “จำนวนสินทรัพย์ที่ลงทะเบียนเมื่อเดือนที่แล้วมีเท่าใด”, “สินทรัพย์ใดบ้างที่จัดว่าเป็นข้อมูลลับ” หรือ “สินทรัพย์ใดบ้างที่ขาดคำอธิบายทางธุรกิจ” ใช้ SQL มาตรฐานโดยไม่ต้องสร้างโครงสร้างพื้นฐาน ETL แบบกำหนดเองสำหรับการรายงาน

ความสามารถนี้จะแปลงข้อมูลเมตาของสินทรัพย์ในแค็ตตาล็อกเป็นตารางที่คิวรีได้โดยอัตโนมัติซึ่งเข้าถึงได้จาก Amazon Athena, โน้ตบุ๊ก SageMaker Unified Studio, AI Agent และเครื่องมือ BI และเครื่องมืออื่น ๆ สำหรับการวิเคราะห์ข้อมูล ตารางที่ส่งออกประกอบด้วยข้อมูลเมตาทางเทคนิค (เช่น resource_id, resource_type), ข้อมูลเมตาทางธุรกิจ (เช่น asset_name, business_description), รายละเอียดความเป็นเจ้าของ และการประทับเวลา ข้อมูลจะถูกแบ่งพาร์ติชันตาม snapshot_date สำหรับคิวรีการย้อนเวลาและจะปรากฏขึ้นโดยอัตโนมัติใน SageMaker Unified Studio ภายใต้บัคเก็ต aws-sagemaker-catalog

ความสามารถนี้ใช้ได้ใน AWS Region ทุกแห่งที่รองรับแค็ตตาล็อก SageMaker โดยไม่มีค่าใช้จ่ายเพิ่มเติม คุณจะชำระเงินเฉพาะบริการพื้นฐานซึ่งรวมถึงพื้นที่เก็บข้อมูลสำหรับตาราง S3 และคิวรี Amazon Athena เท่านั้น คุณสามารถควบคุมค่าใช้จ่ายด้านพื้นที่เก็บข้อมูลได้โดยการตั้งค่านโยบายการเก็บข้อมูลบนตารางที่ส่งออกเพื่อลบระเบียนที่เก่ากว่าช่วงเวลาที่คุณระบุโดยอัตโนมัติ

หากต้องการเริ่มต้นใช้งาน ให้เปิดใช้งานการส่งออกชุดข้อมูลโดยใช้ AWS CLI จากนั้นให้เข้าถึงตารางสินทรัพย์ผ่านตาราง S3 หรือแท็บข้อมูลของ SageMaker Unified Studio ภายใน 24 ชั่วโมง ให้คิวรีโดยใช้ Amazon Athena, โน้ตบุ๊คของสตูดิโอ หรือเชื่อมต่อเครื่องมือ BI ภายนอกผ่านตำแหน่งข้อมูลแค็ตตาล็อก Iceberg REST ของตาราง S3 สำหรับคำแนะนำ โปรดดูที่คู่มือผู้ใช้ Amazon SageMaker