AWS Glue
ค้นพบ จัดเตรียม และรวมข้อมูลทั้งหมดของคุณในทุกขนาด
จัดเก็บ 1 ล้านอ็อบเจกต์ฟรี
วิธีการทำงาน
AWS Glue คือบริการผสานรวมข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ที่ช่วยอำนวยความสะดวกในการค้นหา จัดเตรียม ย้าย ผสานข้อมูลสำหรับการวิเคราะห์ แมชชีนเลิร์นนิง (ML) และการพัฒนาแอปพลิเคชันมากยิ่งขึ้น
-
ตัวเลือกเครื่องมือการผสานรวมข้อมูล
-
ETL เชิงเหตุการณ์
-
แค็ตตาล็อกข้อมูลของ AWS Glue
-
งาน ETL ที่ไม่มีโค้ด
-
จัดการและตรวจสอบคุณภาพข้อมูล
-
การเตรียมข้อมูล
-
ตัวเลือกเครื่องมือการผสานรวมข้อมูล
-
เลือกเครื่องมือการผสานรวมข้อมูลที่คุณต้องการใน AWS Glue เพื่อรองรับผู้ใช้และเวิร์กโหลดของคุณ
-
ETL เชิงเหตุการณ์
-
AWS Glue สามารถเรียกใช้งานกระบวนการ Extract, Transform and Load (ETL) ของคุณได้เมื่อมีข้อมูลใหม่เข้ามา ตัวอย่างเช่น คุณสามารถกำหนดค่า AWS Glue เพื่อเริ่มงาน ETL ของคุณเพื่อเรียกใช้ทันทีที่มีข้อมูลใหม่ใน Amazon Simple Storage Service (S3)
-
แค็ตตาล็อกข้อมูลของ AWS Glue
-
คุณสามารถใช้ Data Catalog เพื่อสำรวจและค้นหาจากชุดข้อมูล AWS หลายชุดได้โดยไม่จำเป็นต้องย้ายข้อมูล เมื่อข้อมูลได้รับการจัดรายการแล้ว จะสามารถค้นหาและสืบค้นได้ทันทีโดยใช้ Amazon Athena Amazon EMR และ Amazon Redshift Spectrum
-
งาน ETL ที่ไม่มีโค้ด
-
AWS Glue Studio ช่วยให้คุณสามารถสร้าง เรียกใช้ และตรวจสอบงาน AWS Glue ETL ได้อย่างง่ายดาย คุณสามารถสร้างงาน ETL ที่จะย้ายและแปลงข้อมูลโดยใช้โปรแกรมแก้ไขแบบลากและปล่อย แล้ว AWS Glue จะสร้างโค้ดขึ้นมาโดยอัตโนมัติ
-
จัดการและตรวจสอบคุณภาพข้อมูล
-
คุณภาพข้อมูลของ AWS Glue ทำให้การสร้างกฎคุณภาพของข้อมูล การจัดการ และการตรวจสอบเป็นไปอย่างอัตโนมัติ เพื่อช่วยให้มั่นใจว่าข้อมูลจะมีคุณภาพสูงทั่วทั้ง Data Lake และไปป์ไลน์ของคุณ
-
การเตรียมข้อมูล
-
ด้วย AWS Glue DataBrew คุณจะสามารถสำรวจและทดลองกับข้อมูลได้โดยตรงจาก Data Lake, คลังข้อมูล และฐานข้อมูลของคุณ ซึ่งรวมถึง Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora และบริการฐานข้อมูลแบบเชิงสัมพันธ์ของ Amazon (RDS) คุณสามารถเลือกรูปแบบการแปลงข้อมูลจากการแปลงข้อมูลที่สร้างไว้ล่วงหน้ากว่า 250 แบบใน DataBrew เพื่อทำให้งานเตรียมข้อมูลเป็นไปโดยอัตโนมัติ เช่น การกรองสิ่งผิดปกติ การจัดรูปแบบข้อมูลให้เป็นแบบมาตรฐาน และการแก้ไขค่าที่ไม่ถูกต้อง
กรณีการใช้งาน
ปรับการพัฒนาไปป์ไลน์ ETL ให้เรียบง่าย
ลบการจัดการโครงสร้างพื้นฐานด้วยการจัดการการจัดสรรและคนงาน และรวบรวมการผสานข้อมูลของคุณที่จำเป็นสำหรับบริการเดี่ยว
ค้นพบข้อมูลอย่างมีประสิทธิภาพ
ระบุข้อมูลข้ามหลายชุดข้อมูล AWS อย่างรวดเร็ว จากนั้นทำให้ข้อมูลนั้นพร้อมต่อคำสั่งและการแปลงสภาพ
สำรวจ ทดลอง และประมวลผลของข้อมูลแบบอินเทอร์แอคทีฟ
โดยใช้เซสชันอินเทอร์แอคทีฟ AWS Glue วิศวกรข้อมูลจะสามารถสำรวจและเตรียมข้อมูลแบบอินเทอร์แอคทีฟโดยอาศัยสภาพแวดล้อมการพัฒนาแบบผสานรวม (IDE) หรือ Notebook ที่ต้องการ
สนับสนุนเฟรมเวิร์กและเวิร์กโหลดสำหรับหลากหลายการประมวลผล
สนับสนุนเฟรมเวิร์กหลากหลายการประมวลผลได้ง่ายขึ้น เช่น ETL และ ELT และหลากหลายเวิร์กโหลดซึ่งมี Batch Micro-Batch, และการสตรีม
วิธีเริ่มต้น
ลอง AWS Glue โดยไม่มีค่าใช้จ่าย
ค้นหา เตรียม ย้าย และรวมข้อมูลจากหลายแหล่งอย่างง่ายดายในสภาพแวดล้อมโดยไม่ต้องใช้เซิร์ฟเวอร์
สร้างด้วย AWS Glue
เรียนรู้วิธีสร้างไปป์ไลน์ข้อมูลโดยใช้อินเทอร์เฟซ ETL แบบแสดงเป็นภาพของ AWS Glue Studio
ผสานรวมข้อมูลของคุณ
ทำตามเพื่อตั้งค่าและเริ่มใช้งาน AWS Glue