AWS Glue

ค้นพบ จัดเตรียม และรวมข้อมูลทั้งหมดของคุณในทุกขนาด

จัดเก็บ 1 ล้านอ็อบเจกต์ฟรี

วิธีการทำงาน

AWS Glue คือบริการผสานรวมข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ที่ช่วยอำนวยความสะดวกในการค้นหา จัดเตรียม ย้าย ผสานข้อมูลสำหรับการวิเคราะห์ แมชชีนเลิร์นนิง (ML) และการพัฒนาแอปพลิเคชันมากยิ่งขึ้น

  • ตัวเลือกเครื่องมือการผสานรวมข้อมูล
  • เลือกเครื่องมือการผสานรวมข้อมูลที่คุณต้องการใน AWS Glue เพื่อรองรับผู้ใช้และเวิร์กโหลดของคุณ

    แผนภาพแสดงถึงตัวเลือกเครื่องมือประมวลผลข้อมูลหลายตัวสำหรับ AWS Glue
  • ETL เชิงเหตุการณ์
  • AWS Glue สามารถเรียกใช้งานกระบวนการ Extract, Transform and Load (ETL) ของคุณได้เมื่อมีข้อมูลใหม่เข้ามา ตัวอย่างเช่น คุณสามารถกำหนดค่า AWS Glue เพื่อเริ่มงาน ETL ของคุณเพื่อเรียกใช้ทันทีที่มีข้อมูลใหม่ใน Amazon Simple Storage Service (S3)

    ภาพแสดงวิธีที่ AWS Glue สามารถเรียกใช้งาน ETL ของคุณได้เมื่อมีข้อมูลใหม่เข้ามา
  • แค็ตตาล็อกข้อมูลของ AWS Glue
  • คุณสามารถใช้ Data Catalog เพื่อสำรวจและค้นหาจากชุดข้อมูล AWS หลายชุดได้โดยไม่จำเป็นต้องย้ายข้อมูล เมื่อข้อมูลได้รับการจัดรายการแล้ว จะสามารถค้นหาและสืบค้นได้ทันทีโดยใช้ Amazon Athena Amazon EMR และ Amazon Redshift Spectrum

    ภาพแสดง Data Catalog เพื่อสำรวจและค้นหาชุดข้อมูลโดยไม่ต้องย้ายข้อมูล
  • งาน ETL ที่ไม่มีโค้ด
  • AWS Glue Studio ช่วยให้คุณสามารถสร้าง เรียกใช้ และตรวจสอบงาน AWS Glue ETL ได้อย่างง่ายดาย คุณสามารถสร้างงาน ETL ที่จะย้ายและแปลงข้อมูลโดยใช้โปรแกรมแก้ไขแบบลากและปล่อย แล้ว AWS Glue จะสร้างโค้ดขึ้นมาโดยอัตโนมัติ

    ภาพแสดงวิธีการสร้างงาน ETL ที่จะย้ายและแปลงข้อมูลโดยใช้โปรแกรมแก้ไขแบบลากและปล่อย
  • จัดการและตรวจสอบคุณภาพข้อมูล
  • คุณภาพข้อมูลของ AWS Glue ทำให้การสร้างกฎคุณภาพของข้อมูล การจัดการ และการตรวจสอบเป็นไปอย่างอัตโนมัติ เพื่อช่วยให้มั่นใจว่าข้อมูลจะมีคุณภาพสูงทั่วทั้ง Data Lake และไปป์ไลน์ของคุณ

    แผนภาพแสดงถึงวิธีที่คุณภาพข้อมูลของ AWS Glue วัดผล ตรวจสอบ และจัดการคุณภาพข้อมูลโดยอัตโนมัติใน Data Lake และไปป์ไลน์ข้อมูล
  • การเตรียมข้อมูล
  • ด้วย AWS Glue DataBrew คุณจะสามารถสำรวจและทดลองกับข้อมูลได้โดยตรงจาก Data Lake, คลังข้อมูล และฐานข้อมูลของคุณ ซึ่งรวมถึง Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora และบริการฐานข้อมูลแบบเชิงสัมพันธ์ของ Amazon (RDS) คุณสามารถเลือกรูปแบบการแปลงข้อมูลจากการแปลงข้อมูลที่สร้างไว้ล่วงหน้ากว่า 250 แบบใน DataBrew เพื่อทำให้งานเตรียมข้อมูลเป็นไปโดยอัตโนมัติ เช่น การกรองสิ่งผิดปกติ การจัดรูปแบบข้อมูลให้เป็นแบบมาตรฐาน และการแก้ไขค่าที่ไม่ถูกต้อง

    ภาพแกรมแสดงวิธีที่ DataBrew ดำเนินการจัดเตรียมข้อมูลสำหรับผู้ใช้โดยอัตโนมัติ
บทนำเกี่ยวกับ AWS Glue (01:54)
ทำไมต้อง AWS Glue
การเตรียมข้อมูลของคุณเพื่อให้ได้ผลลัพธ์ที่มีคุณภาพเป็นขั้นตอนแรกในโครงการวิเคราะห์หรือ ML AWS Glue เป็นบริการการรวมข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ที่ทำให้การเตรียมข้อมูลง่ายขึ้น เร็วขึ้น และถูกกว่า คุณสามารถค้นพบและเชื่อมต่อกับแหล่งที่มาของข้อมูลที่หลากหลายกว่า 70 แห่ง จัดการข้อมูลของคุณในแค็ตตาล็อกข้อมูลแบบรวมศูนย์ และสร้าง เรียกใช้ และตรวจสอบไปป์ไลน์ภาพ ETL เพื่อลงข้อมูลใน Data Lake ของคุณ

กรณีการใช้งาน

ปรับการพัฒนาไปป์ไลน์ ETL ให้เรียบง่าย

ลบการจัดการโครงสร้างพื้นฐานด้วยการจัดการการจัดสรรและคนงาน และรวบรวมการผสานข้อมูลของคุณที่จำเป็นสำหรับบริการเดี่ยว

เรียนรู้เพิ่มเติมเกี่ยวกับการปรับขนาด AWS Glue โดยอัตโนมัติ »

ค้นพบข้อมูลอย่างมีประสิทธิภาพ

ระบุข้อมูลข้ามหลายชุดข้อมูล AWS อย่างรวดเร็ว จากนั้นทำให้ข้อมูลนั้นพร้อมต่อคำสั่งและการแปลงสภาพ

เรียนรู้เพิ่มเติมเกี่ยวกับแค็ตตาล็อกข้อมูลของ AWS Glue »

สำรวจ ทดลอง และประมวลผลของข้อมูลแบบอินเทอร์แอคทีฟ

โดยใช้เซสชันอินเทอร์แอคทีฟ AWS Glue วิศวกรข้อมูลจะสามารถสำรวจและเตรียมข้อมูลแบบอินเทอร์แอคทีฟโดยอาศัยสภาพแวดล้อมการพัฒนาแบบผสานรวม (IDE) หรือ Notebook ที่ต้องการ

เรียนรู้เพิ่มเติมเกี่ยวกับเซสชันอินเทอร์แอคทีฟ AWS Glue »

สนับสนุนเฟรมเวิร์กและเวิร์กโหลดสำหรับหลากหลายการประมวลผล

สนับสนุนเฟรมเวิร์กหลากหลายการประมวลผลได้ง่ายขึ้น เช่น ETL และ ELT และหลากหลายเวิร์กโหลดซึ่งมี Batch Micro-Batch, และการสตรีม

เรียนรู้เพิ่มเติมเกี่ยวกับการสตรีมงาน ETL »

วิธีเริ่มต้น

ลอง AWS Glue โดยไม่มีค่าใช้จ่าย

ค้นหา เตรียม ย้าย และรวมข้อมูลจากหลายแหล่งอย่างง่ายดายในสภาพแวดล้อมโดยไม่ต้องใช้เซิร์ฟเวอร์

สร้างด้วย AWS Glue

เรียนรู้วิธีสร้างไปป์ไลน์ข้อมูลโดยใช้อินเทอร์เฟซ ETL แบบแสดงเป็นภาพของ AWS Glue Studio

ผสานรวมข้อมูลของคุณ

ทำตามเพื่อตั้งค่าและเริ่มใช้งาน AWS Glue


สำรวจ AWS เพิ่มเติม