ทำไมต้อง AWS Glue
การเตรียมข้อมูลของคุณเพื่อให้ได้ผลลัพธ์ที่มีคุณภาพเป็นขั้นตอนแรกในโครงการวิเคราะห์หรือ ML AWS Glue เป็นบริการการรวมข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ที่ทำให้การเตรียมข้อมูลง่ายขึ้น เร็วขึ้น และถูกกว่า คุณสามารถค้นพบและเชื่อมต่อกับแหล่งที่มาของข้อมูลอันหลากหลายกว่า 70 แหล่ง จัดการข้อมูลของคุณในแค็ตตาล็อกข้อมูลแบบรวมศูนย์ รวมไปถึงสร้างภาพ เรียกใช้ และตรวจสอบไปป์ไลน์ ETL เพื่อโหลดข้อมูลใน Data Lake ของคุณ
แนะนำเบื้องต้นเกี่ยวกับ AWS Glue (01:54)

ประโยชน์ของ AWS Glue

สนับสนุนผู้ใช้ข้อมูลทั้งหมด ตั้งแต่นักพัฒนาไปจนถึงผู้ใช้ทางธุรกิจ
ความสามารถในการผสานรวมข้อมูลที่ครบถ้วนในบริการแบบไม่ต้องใช้เซิร์ฟเวอร์เดียว
ค่าบริการตามการใช้งานจริงในระดับเพตะไบต์สำหรับข้อมูลทุกขนาด
การสนับสนุนที่ยืดหยุ่นสำหรับ ETL, ELT, แบตช์, การสตรีม และอื่น ๆ อีกมากมายโดยไม่มีการผูกมัด

วิธีการทำงาน

AWS Glue คือบริการผสานรวมข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ที่ช่วยอำนวยความสะดวกในการค้นหา จัดเตรียม ย้าย ผสานข้อมูลสำหรับการวิเคราะห์ แมชชีนเลิร์นนิง (ML) และการพัฒนาแอปพลิเคชันมากยิ่งขึ้น

  • ตัวเลือกเครื่องมือการผสานรวมข้อมูล
  • เลือกเครื่องมือการผสานรวมข้อมูลที่คุณต้องการใน AWS Glue เพื่อรองรับผู้ใช้และเวิร์กโหลดของคุณ

    แผนภาพแสดงถึงตัวเลือกเครื่องมือประมวลผลข้อมูลหลายตัวสำหรับ AWS Glue
  • ETL เชิงเหตุการณ์
  • AWS Glue สามารถเรียกใช้งานกระบวนการ Extract, Transform and Load (ETL) ของคุณได้เมื่อมีข้อมูลใหม่เข้ามา ตัวอย่างเช่น คุณสามารถกำหนดค่า AWS Glue เพื่อเริ่มงาน ETL ของคุณเพื่อเรียกใช้ทันทีที่มีข้อมูลใหม่ใน Amazon Simple Storage Service (S3)

    ภาพแสดงวิธีที่ AWS Glue สามารถเรียกใช้งาน ETL ของคุณได้เมื่อมีข้อมูลใหม่เข้ามา
  • แค็ตตาล็อกข้อมูลของ AWS Glue
  • คุณสามารถใช้ Data Catalog เพื่อสำรวจและค้นหาจากชุดข้อมูล AWS หลายชุดได้โดยไม่จำเป็นต้องย้ายข้อมูล เมื่อข้อมูลได้รับการจัดรายการแล้ว จะสามารถค้นหาและสืบค้นได้ทันทีโดยใช้ Amazon Athena Amazon EMR และ Amazon Redshift Spectrum

    ภาพแสดง Data Catalog เพื่อสำรวจและค้นหาชุดข้อมูลโดยไม่ต้องย้ายข้อมูล
  • งาน ETL ที่ไม่มีโค้ด
  • AWS Glue Studio ช่วยให้คุณสามารถสร้าง เรียกใช้ และตรวจสอบงาน AWS Glue ETL ได้อย่างง่ายดาย คุณสามารถสร้างงาน ETL ที่จะย้ายและแปลงข้อมูลโดยใช้โปรแกรมแก้ไขแบบลากและปล่อย แล้ว AWS Glue จะสร้างโค้ดขึ้นมาโดยอัตโนมัติ

    ภาพแสดงวิธีการสร้างงาน ETL ที่จะย้ายและแปลงข้อมูลโดยใช้โปรแกรมแก้ไขแบบลากและปล่อย
  • จัดการและตรวจสอบคุณภาพข้อมูล
  • คุณภาพข้อมูลของ AWS Glue ทำให้การสร้างกฎคุณภาพของข้อมูล การจัดการ และการตรวจสอบเป็นไปอย่างอัตโนมัติ เพื่อช่วยให้มั่นใจว่าข้อมูลจะมีคุณภาพสูงทั่วทั้ง Data Lake และไปป์ไลน์ของคุณ

    แผนภาพแสดงถึงวิธีที่คุณภาพข้อมูลของ AWS Glue วัดผล ตรวจสอบ และจัดการคุณภาพข้อมูลโดยอัตโนมัติใน Data Lake และไปป์ไลน์ข้อมูล
  • การเตรียมข้อมูล
  • ด้วย AWS Glue DataBrew คุณจะสามารถสำรวจและทดลองกับข้อมูลได้โดยตรงจาก Data Lake, คลังข้อมูล และฐานข้อมูลของคุณ ซึ่งรวมถึง Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora และบริการฐานข้อมูลแบบเชิงสัมพันธ์ของ Amazon (RDS) คุณสามารถเลือกรูปแบบการแปลงข้อมูลจากการแปลงข้อมูลที่สร้างไว้ล่วงหน้ากว่า 250 แบบใน DataBrew เพื่อทำให้งานเตรียมข้อมูลเป็นไปโดยอัตโนมัติ เช่น การกรองสิ่งผิดปกติ การจัดรูปแบบข้อมูลให้เป็นแบบมาตรฐาน และการแก้ไขค่าที่ไม่ถูกต้อง

    นอกจากนี้ AWS Glue Studio ยังมีเครื่องมือเตรียมข้อมูลที่ช่วยให้คุณสามารถเตรียมข้อมูลด้วยอินเทอร์เฟซภาพแบบโต้ตอบแบบชี้และคลิกโดยไม่ต้องเขียนรหัส

    แผนผังแสดงวิธีที่ DataBrew ดำเนินงานจัดเตรียมข้อมูลให้ผู้ใช้โดยอัตโนมัติ

กรณีใช้งาน

ค้นพบข้อมูลอย่างมีประสิทธิภาพ

ระบุข้อมูลข้าม AWS, ในองค์กร และระบบคลาวด์อื่นๆ ได้อย่างรวดเร็ว จากนั้นทำให้ข้อมูลดังกล่าวพร้อมทันทีสำหรับการสืบค้นและการแปลงสภาพ

สนับสนุนเฟรมเวิร์กและเวิร์กโหลดสำหรับหลากหลายการประมวลผล

สนับสนุนเฟรมเวิร์กหลากหลายการประมวลผลได้ง่ายขึ้น เช่น ETL และ ELT และหลากหลายเวิร์กโหลดซึ่งมี Batch Micro-Batch, และการสตรีม

ปรับการพัฒนาไปป์ไลน์ ETL ให้เรียบง่าย

ลบการจัดการโครงสร้างพื้นฐานด้วยการจัดการการจัดสรรและคนงาน และรวบรวมการผสานข้อมูลของคุณที่จำเป็นสำหรับบริการเดี่ยว

สำรวจ ทดลอง และประมวลผลของข้อมูลแบบอินเทอร์แอคทีฟ

โดยใช้เซสชันอินเทอร์แอคทีฟ AWS Glue วิศวกรข้อมูลจะสามารถสำรวจและเตรียมข้อมูลแบบอินเทอร์แอคทีฟโดยอาศัยสภาพแวดล้อมการพัฒนาแบบผสานรวม (IDE) หรือ Notebook ที่ต้องการ

มีอะไรใหม่

  • วันที่ (จากใหม่สุดไปเก่าสุด)
ไม่พบผลลัพธ์
1

สำรวจ AWS เพิ่มเติม