AWS Glue

การผสานรวมข้อมูลที่เรียบง่าย ปรับขนาดได้ และไร้เซิร์ฟเวอร์

AWS Glue คือบริการผสานรวมข้อมูลแบบไร้เซิร์ฟเวอร์ที่ช่วยอำนวยความสะดวกในการค้นหา จัดเตรียม และรวมข้อมูลสำหรับการวิเคราะห์ แมชชีนเลิร์นนิ่ง และการพัฒนาแอปพลิเคชัน AWS Glue มอบความสามารถทุกอย่างที่จำเป็นสำหรับการผสานรวมข้อมูล เพื่อให้คุณเริ่มต้นการวิเคราะห์ข้อมูลแล้วนำไปใช้ได้ในไม่กี่นาทีแทนที่จะใช้เวลาหลายเดือน

การผสานรวมข้อมูลคือกระบวนการจัดเตรียมและรวมข้อมูลเพื่อใช้ในการวิเคราะห์ แมชชีนเลิร์นนิ่ง และการพัฒนาแอปพลิเคชัน กระบวนการนี้เกี่ยวข้องกับงานหลายๆ อย่าง เช่น การค้นหาและแยกข้อมูลจากแหล่งที่มาต่างๆ การเพิ่มความสมบูรณ์ การล้าง การปรับให้อยู่ในรูปแบบบรรทัดฐาน และการรวมข้อมูล รวมถึงการโหลดและจัดระเบียบข้อมูลในฐานข้อมูล คลังข้อมูล และที่จัดเก็บข้อมูลดิบ บ่อยครั้งที่งานเหล่านี้ได้รับการจัดการโดยผู้ใช้คนละประเภท ซึ่งแต่ละรายก็ใช้ผลิตภัณฑ์ที่แตกต่างกันไป

AWS Glue มีอินเทอร์เฟซทั้งแบบภาพและแบบโค้ดเพื่อช่วยให้การผสานรวมข้อมูลทำได้ง่ายขึ้น ผู้ใช้สามารถค้นหาและเข้าถึงข้อมูลได้อย่างง่ายดายโดยใช้ AWS Glue Data Catalog วิศวกรข้อมูลและนักพัฒนา ETL (แยก แปลง และโหลด) สามารถสร้าง เรียกใช้ และตรวจสอบเวิร์กโฟลว์ ETL ด้วยภาพได้ภายในไม่กี่คลิกจากใน AWS Glue Studio นักวิเคราะห์ข้อมูลและนักวิทยาศาสตร์ข้อมูลสามารถใช้ AWS Glue DataBrew เพื่อเพิ่มความสมบูรณ์ ล้าง และปรับข้อมูลให้อยู่ในรูปแบบบรรทัดฐานด้วยภาพได้โดยไม่ต้องเขียนโค้ด AWS Glue Elastic Views ช่วยให้นักพัฒนาแอปพลิเคชันสามารถใช้ภาษาสอบถามเชิงโครงสร้าง (SQL) ที่คุ้นเคยในการรวมและทำสำเนาข้อมูลระหว่างที่เก็บข้อมูลต่างๆ ได้

จัดเก็บ 1 ล้านอ็อบเจ็กต์ฟรี

ด้วย AWS Free Tier

ประโยชน์

การผสานรวมข้อมูลที่รวดเร็วยิ่งขึ้น

กลุ่มต่างๆ ในองค์กรของคุณสามารถใช้ AWS Glue เพื่อร่วมกันทำงานที่เกี่ยวข้องกับการผสานรวมข้อมูล ซึ่งประกอบด้วยการแยก การล้าง การปรับให้อยู่ในรูปแบบบรรทัดฐาน การรวม การโหลด และการเรียกใช้เวิร์กโฟลว์ ETL ที่ปรับขนาดได้ วิธีนี้ช่วยร่นระยะเวลาที่ต้องใช้ในการวิเคราะห์ข้อมูลและนำไปใช้ให้สั้นลงจากหลายเดือนเหลือเพียงไม่กี่นาที

ปรับการผสานรวมข้อมูลของคุณให้เป็นแบบอัตโนมัติตามขนาด

AWS Glue ทำให้งานส่วนใหญ่ที่ต้องดำเนินการเพื่อการผสานรวมข้อมูลเป็นไปโดยอัตโนมัติ AWS Glue จะรวบรวมแหล่งข้อมูล ระบุรูปแบบข้อมูล และแนะนำสคีมาในการจัดเก็บข้อมูลของคุณ โดยจะสร้างโค้ดโดยอัตโนมัติเพื่อเรียกใช้การแปลงข้อมูลและกระบวนการโหลด คุณสามารถใช้ AWS Glue เพื่อเรียกใช้และจัดการงาน ETL หลายพันรายการ หรือเพื่อรวมและทำสำเนาข้อมูลระหว่างที่เก็บข้อมูลต่างๆ โดยใช้ SQL ได้อย่างง่ายดาย

ไม่มีเซิร์ฟเวอร์ให้ต้องจัดการ

AWS Glue ทำงานในสภาพแวดล้อมแบบไร้เซิร์ฟเวอร์ ไม่มีโครงสร้างพื้นฐานให้ต้องจัดการ และ AWS Glue จะจัดเตรียม กำหนดค่า และปรับขนาดทรัพยากรที่จำเป็นในการเรียกใช้งานด้านการผสานรวมข้อมูลของคุณ ระบบจะเรียกเก็บค่าบริการเฉพาะสำหรับทรัพยากรที่งานของคุณใช้ในขณะดำเนินการเท่านั้น

กรณีการใช้งาน


สร้างไปป์ไลน์ ETL (แยก แปลง และโหลด) เชิงเหตุการณ์

AWS Glue สามารถเรียกใช้งาน ETL ของคุณได้เมื่อมีข้อมูลใหม่เข้ามา ตัวอย่างเช่น คุณสามารถใช้ฟังก์ชัน AWS Lambda เพื่อเรียกใช้งาน ETL ให้ทำงานทันทีที่ข้อมูลใหม่พร้อมใช้งานใน Amazon S3 คุณยังสามารถลงทะเบียนชุดข้อมูลใหม่นี้ใน AWS Glue Data Catalog ให้เป็นส่วนหนึ่งของงาน ETL ของคุณได้

ไดอะแกรมไปป์ไลน์ ETL เชิงเหตุการณ์

สร้างแค็ตตาล็อกแบบรวมเพื่อค้นหาข้อมูลระหว่างที่เก็บข้อมูลต่างๆ

คุณสามารถใช้ AWS Glue Data Catalog เพื่อสำรวจและค้นหาจากชุดข้อมูล AWS หลายชุดได้โดยไม่จำเป็นต้องย้ายข้อมูล เมื่อข้อมูลได้รับการจัดรายการแล้ว จะสามารถค้นหาและสืบค้นได้ทันทีโดยใช้ Amazon Athena, Amazon EMR และ Amazon Redshift Spectrum

สร้างและเรียกใช้งาน ELT ใน AWS Glue

สร้าง เรียกใช้ และตรวจสอบงาน ETL โดยไม่ต้องเขียนโค้ด

AWS Glue Studio ช่วยให้คุณสามารถสร้าง เรียกใช้ และตรวจสอบงาน AWS Glue ETL ได้อย่างง่ายดาย คุณสามารถสร้างงาน ETL ที่จะย้ายและแปลงข้อมูลโดยใช้โปรแกรมแก้ไขแบบลากและปล่อย แล้ว AWS Glue จะสร้างโค้ดขึ้นมาโดยอัตโนมัติ จากนั้นคุณสามารถใช้แดชบอร์ดการเรียกใช้งาน AWS Glue Studio เพื่อตรวจสอบการดำเนินการ ETL และรับรองให้แน่ใจว่างานต่างๆ ของคุณทำงานได้ตามวัตถุประสงค์ เรียนรู้เพิ่มเติมเกี่ยวกับ AWS Glue Studio ที่นี่

เครื่องมือ Visual ETL สำหรับนักพัฒนา ETL

สำรวจข้อมูลด้วยการเตรียมข้อมูลภาพแบบบริการตนเอง

AWS Glue DataBrew ช่วยให้คุณสามารถสำรวจและทดลองกับข้อมูลได้โดยตรงจากที่จัดเก็บข้อมูลดิบ คลังข้อมูล และฐานข้อมูลของคุณ ซึ่งรวมถึง Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora และ Amazon RDS คุณสามารถเลือกรูปแบบการแปลงข้อมูลจากการแปลงข้อมูลที่สร้างไว้ล่วงหน้ากว่า 250 แบบใน AWS Glue DataBrew เพื่อทำให้งานเตรียมข้อมูลเป็นไปโดยอัตโนมัติ เช่น การกรองสิ่งผิดปกติ การจัดรูปแบบข้อมูลให้เป็นแบบมาตรฐาน และการแก้ไขค่าที่ไม่ถูกต้อง หลังจากเตรียมข้อมูลเสร็จแล้ว คุณสามารถใช้ข้อมูลดังกล่าวเพื่อการวิเคราะห์และแมชชีนเลิร์นนิ่งได้ทันที เรียนรู้เพิ่มเติมเกี่ยวกับ AWS Glue DataBrew ที่นี่

การทำความสะอาดข้อมูลภาพและการนอร์มัลไลซ์ข้อมูล

สร้างมุมมองที่เป็นรูปธรรมเพื่อรวมและทำสำเนาข้อมูล (ในการแสดงตัวอย่าง)

AWS Glue Elastic Views ช่วยให้คุณใช้ SQL ที่คุ้นเคยในการสร้างมุมมองที่เป็นรูปธรรมขึ้นมาได้ ใช้มุมมองเหล่านี้เพื่อเข้าถึงและรวมข้อมูลจากที่เก็บข้อมูลต้นทางหลายๆ แห่ง แล้วเก็บข้อมูลที่รวมไว้นั้นให้เป็นปัจจุบันอยู่เสมอและเข้าถึงได้จากที่เก็บข้อมูลเป้าหมาย ขณะนี้ การแสดงตัวอย่างของ AWS Glue Elastic Views สนับสนุน Amazon DynamoDB เป็นที่เก็บข้อมูลต้นทาง และกำลังจะสนับสนุน Amazon Aurora และ Amazon RDS ในอนาคต ส่วนที่เก็บข้อมูลเป้าหมายที่ได้รับการสนับสนุนอยู่ในขณะนี้ ได้แก่ Amazon Redshift, Amazon S3 และ Amazon Elasticsearch Service และกำลังจะสนับสนุน Amazon Aurora, Amazon RDS และ Amazon DynamoDB ในอนาคต เรียนรู้เพิ่มเติมเกี่ยวกับ AWS Glue Elastic Views ที่นี่

การทำความสะอาดข้อมูลภาพและการนอร์มัลไลซ์ข้อมูล

มีอะไรใหม่

วันที่
  • วันที่
1
คุณสมบัติของ AWS Glue
ตรวจสอบคุณสมบัติของ AWS Glue

เรียนรู้เพิ่มเติมเกี่ยวกับคุณสมบัติหลักของ AWS Glue

เรียนรู้เพิ่มเติม 
ลงชื่อสมัครใช้งานบัญชี AWS
ลงชื่อสมัครใช้บัญชีฟรี

รับสิทธิ์การเข้าถึง AWS Free Tier ได้ทันที 

ลงชื่อสมัครใช้งาน 
เริ่มต้นสร้างใน Console
เริ่มต้นสร้างใน AWS Glue

เริ่มต้นสร้างด้วย AWS Glue ในอินเทอร์เฟซ ETL เสมือน

ลงชื่อเข้าใช้