Amazon SageMaker นำเสนอการแปลง Visual ETL เพิ่มเติมและการรองรับตาราง S3

โพสต์บน: 6 พ.ค. 2025

ขณะนี้ Amazon SageMaker มีการแปลง Visual ETL ในตัวใหม่ 14 รายการ ได้แก่ “จัดรูปแบบการประทับเวลา”, “แยกสตริง”, “ตัวแยก Regex”, “การประมวลผลสมดุลอัตโนมัติ”, “UUID (ระบุที่ไม่ซ้ำกันสากล)”, “ตัวระบุ”, “เลิกหมุนคอลัมน์เป็นแถว”, “หมุนแถวเป็นคอลัมน์”, “แยกวิเคราะห์คอลัมน์ JSON”, “แยกเส้นทาง JSON”, “การค้นหา”, “เราเตอร์ตามเงื่อนไข” “กลุ่มเส้นทาง” และ “เรียงตาม” การแปลงรูปแบบใหม่เหล่านี้จะช่วยให้นักพัฒนา ETL สร้างไปป์ไลน์ข้อมูลที่ซับซ้อนมากขึ้นได้อย่างรวดเร็วโดยไม่ต้องเขียนโค้ดที่กำหนดเองให้กับงานแปลงทั่วไป นอกจากนี้ตาราง Amazon S3 ยังรองรับผ่านโหนด Amazon SageMaker Lakehouse แล้วด้วย โดยมอบความยืดหยุ่นในการเข้าถึงและดูตัวอย่างข้อมูลแบบ In-place ในตาราง S3

Visual ETL ใน Amazon SageMaker มีอินเทอร์เฟซแบบลากและวางสำหรับการสร้างโฟลว์ ETL และโฟลว์การเขียนด้วย Amazon Q Developer การแปลง Visual ETL ใหม่แต่ละรายการตอบสนองความต้องการในการประมวลผลข้อมูลเฉพาะตัว ตัวอย่างเช่น ใช้ “ตัวระบุ” เพื่อกำหนดตัวระบุตัวเลขสำหรับแต่ละแถวในชุดข้อมูล แปลงสตริง JSON ด้วย “แยกวิเคราะห์คอลัมน์ JSON” ซึ่งช่วยให้คุณสามารถแปลงสตริง JSON เป็นโครงสร้างข้อมูลหรืออาร์เรย์ หรือแยกเฉพาะเส้นทาง JSON ที่คุณต้องการด้วยการแปลง “แยกเส้นทาง JSON”

ขณะนี้การแปลง Visual ETL เหล่านี้พร้อมใช้งานแล้วใน AWS Region ทุกแห่งที่ Amazon SageMaker ให้บริการ เข้าถึงรายการรีเจี้ยนที่รองรับเพื่อดูข้อมูลความพร้อมใช้งานล่าสุด

หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่เอกสารประกอบ Amazon SageMaker