AWS Glue ช่วยให้คุณชำระอัตรารายชั่วโมงซึ่งเรียกเก็บตามวินาทีสำหรับโปรแกรมรวบรวมข้อมูล (การค้นพบข้อมูล) และงานการนำเข้า แปลง และเก็บ (Extract-Transform-Load (ETL)) (ประมวลผลและโหลดข้อมูล) แค็ตตาล็อกข้อมูลของ AWS Glue ช่วยให้คุณสามารถชำระเพียงค่าธรรมเนียมรายเดือนสำหรับการจัดเก็บและการเข้าถึงข้อมูลเมตา ให้คุณจัดเก็บหนึ่งล้านอ็อบเจ็กต์แรกได้ฟรี และเข้าถึงหนึ่งล้านครั้งแรกได้ฟรี หากคุณจัดเตรียมตำแหน่งข้อมูลการพัฒนาเพื่อพัฒนาโค้ด ETL อย่างต่อเนื่อง คุณจะชำระอัตรารายชั่วโมงซึ่งเรียกเก็บตามวินาที สำหรับ AWS Glue DataBrew ระบบจะเรียกเก็บค่าบริการเซสชันแบบอินเทอร์แอคทีฟเป็นรายเซสชัน และเรียกเก็บค่าบริการงาน DataBrew เป็นรายนาที การใช้งานรีจิสทรีของ AWS Glue Schema นั้นไม่มีค่าใช้จ่ายเพิ่มเติม
หมายเหตุ: ราคาอาจแตกต่างกันออกไปตาม AWS Region
-
งาน ETL และเซสชันแบบอินเทอร์แอคทีฟ
-
แค็ตตาล็อกข้อมูล
-
โปรแกรมรวบรวมข้อมูล
-
เซสชันแบบอินเทอร์แอคทีฟ DataBrew
-
งาน DataBrew
-
คุณภาพข้อมูล
-
งาน ETL และเซสชันแบบอินเทอร์แอคทีฟ
-
ตัวอย่างราคา
งาน ETL: สมมติว่างาน AWS Glue Apache Spark รันเป็นเวลา 15 นาทีและใช้ 6 DPU ราคาของ 1 DPU ต่อชั่วโมงคือ 0.44 USD เนื่องจากงานของคุณรันเป็นเวลา 1/4 ของชั่วโมง และใช้ 6 DPU ดังนั้น AWS จะเรียกเก็บเงินจากคุณ 6 DPU * 1/4 ชั่วโมง * 0.44 USD หรือ 0.66 USD
AWS Glue Studio Job Notebooks และเซสชันแบบอินเทอร์แอคทีฟ: สมมติว่าคุณใช้โน๊ตบุ๊กใน AWS Glue Studio เพื่อพัฒนาโค้ด ETL ของคุณแบบอินเทอร์แอคทีฟ ตามค่าเริ่มต้น เซสชันแบบอินเทอร์แอคทีฟจะมี 5 DPU หากคุณรันเซสชันเป็นเวลา 24 นาทีหรือ 2/5 ชั่วโมง คุณจะถูกเรียกเก็บค่าบริการสำหรับ 5 DPU * 2/5 ชั่วโมงที่ 0.44 USD ต่อ DPU ต่อชั่วโมง หรือ 0.88 USD
ML Transforms: เช่นเดียวกับการรันงาน AWS Glue ค่าใช้จ่ายในการรัน ML Transforms ซึ่งรวมถึง FindMatches ในข้อมูลของคุณจะแตกต่างกันไปตามขนาดของข้อมูล เนื้อหาของข้อมูล และจำนวนและประเภทของโหนดที่คุณใช้ ในตัวอย่างต่อไปนี้ เราใช้ FindMatches เพื่อผสานข้อมูลที่เป็นจุดสนใจจากแหล่งที่มาของข้อมูลหลายแหล่งเข้าด้วยกัน หากคุณมีชุดข้อมูลขนาด ~11,000,000 แถว (1.6 GB) ข้อมูลป้าย (ตัวอย่างของคู่ที่ตรงกันจริงหรือคู่ที่ไม่ตรงกันจริง) ขนาด ~8,000 แถว (641 KB) ที่รันบนอินสแตนซ์ประเภท G.2x จำนวน 16 หน่วย คุณจะต้องใช้รันไทม์ในการสร้างชุดป้าย 34 นาที โดยมีค่าใช้จ่าย 8.23 USD ใช้รันไทม์ในการประมาณตัววัด 11 นาที โดยมีค่าใช้จ่าย 2.66 USD และใช้รันไทม์ในการดำเนินงาน FindingMatches 32 นาที โดยมีค่าใช้จ่าย 7.75 USD
-
แค็ตตาล็อกข้อมูล
-
ตัวอย่างราคา
Free Tier ของแค็ตตาล็อกข้อมูลของ AWS Glue: สมมติว่าคุณจัดเก็บหนึ่งล้านตารางในแค็ตตาล็อกข้อมูลภายในเดือนที่กำหนดและส่ง 1 ล้านคำขอเพื่อเข้าถึงตารางเหล่านี้ คุณจะต้องชำระค่าบริการ 0 USD เนื่องจากการใช้งานของคุณครอบคลุมอยู่ในช่วง Free Tier ของแค็ตตาล็อกข้อมูลของ AWS Glue คุณสามารถจัดเก็บหนึ่งล้านอ็อบเจ็กต์แรกและส่งหนึ่งล้านคำขอต่อเดือนได้ฟรี
แค็ตตาล็อกข้อมูลของ AWS Glue: ตอนนี้สมมติว่าการใช้งานพื้นที่จัดเก็บของคุณยังคงเท่าเดิมที่ 1 ล้านตารางต่อเดือน แต่คำขอเพิ่มขึ้นสองเท่าเป็น 2 ล้านคำขอต่อเดือน สมมติว่าคุณยังใช้โปรแกรมรวบรวมข้อมูลเพื่อค้นหาตารางใหม่และรันโปรแกรมเป็นเวลา 30 นาทีและใช้ไป 2 DPU
ค่าใช้จ่ายของพื้นที่จัดเก็บของคุณก็จะยังคงเป็น 0 USD เนื่องจากพื้นที่จัดเก็บสำหรับหนึ่งล้านตารางแรกไม่เสียค่าบริการ หนึ่งล้านคำขอแรกก็ไม่เสียค่าบริการเช่นกัน จะมีการเรียกเก็บค่าบริการคุณสำหรับ 1 ล้านคำขอนอกเหนือช่วง Free Tier ซึ่งก็คือ 1 USD โปรแกรมรวบรวมข้อมูลมีค่าบริการที่ 0.44 USD ต่อ DPU-ชั่วโมง ดังนั้นคุณจะชำระสำหรับ 2 DPU * 1/2 ชั่วโมงที่ 0.44 USD ต่อ DPU-ชั่วโมงหรือ 0.44 USD
หากคุณสร้างสถิติบนตาราง Glue และการรันสถิติใช้เวลา 10 นาทีและใช้ DPU 1 ตัว คุณจะถูกเรียกเก็บเงิน DPU 1 ตัว* 1/6 ชั่วโมง * 0.44 USD/DPU-ชั่วโมง ซึ่งเท่ากับ 0.07 USD
หากคุณบีบอัดตาราง Apache Iceberg และการบีบอัดทำงานเป็นเวลา 30 นาทีและใช้ DPU 2 ตัว คุณจะถูกเรียกเก็บเงิน DPU 2 ตัว* 1/2 ชั่วโมง * 0.44 USD/DPU-ชั่วโมง ซึ่งเท่ากับ 0.44 USD -
โปรแกรมรวบรวมข้อมูล
-
-
เซสชันแบบอินเทอร์แอคทีฟ DataBrew
-
ตัวอย่างราคา
AWS Glue DataBrew: ราคาสำหรับเซสชันแบบอินเทอร์แอคทีฟ 30 นาทีแต่ละเซสชันคือ 1.00 USD หากคุณเริ่มเซสชันในเวลา 9.00 น. แล้วออกจากคอนโซลทันที และกลับมาในเวลา 9.20 น. - 9.30 น. การดำเนินการนี้จะใช้ 1 เซสชันโดยมีมูลค่ารวมที่ 1.00 USD
หากคุณเริ่มเซสชันเวลา 9.00 น. และโต้ตอบกับคอนโซล DataBrew จนถึงเวลา 9.50 น. ให้ออกจากพื้นที่โปรเจกต์ DataBrew และกลับมาดำเนินการโต้ตอบครั้งสุดท้ายเวลา 10.15 น. การดำเนินการนี้จะใช้ 3 เซสชันและระบบจะเรียกเก็บค่าบริการคุณ 1.00 USD ต่อเซสชัน รวมเป็นเงิน 3.00 USD
-
งาน DataBrew
-
ตัวอย่างราคา
DataBrew: หากงาน AWS Glue DataBrew รันเป็นเวลา 10 นาทีและใช้โหนด DataBrew 5 โหนด ราคาจะอยู่ที่ 0.40 USD เนื่องจากงานทำงานเป็นเวลา 1/6 ชั่วโมงและใช้ไปแล้ว 5 โหนด ระบบจึงจะเรียกเก็บค่าบริการสำหรับ 5 โหนด * 1/6 ชั่วโมง * 0.48 USD ต่อชั่วโมงทำงานของโหนด รวมเป็นเงิน 0.40 USD
-
คุณภาพข้อมูล
-
ตัวอย่างราคา
ตัวอย่างที่ 1 – รับคำแนะนำสำหรับตารางในแค็ตตาล็อกข้อมูล
ตัวอย่างเช่น ลองพิจารณางานคำแนะนำที่มี 5 DPU ที่มีการดำเนินการเสร็จสิ้นภายใน 10 นาที คุณจะจ่าย 5 DPU * 1/6 ชั่วโมง * 0.44 USD ซึ่งคิดเป็น 0.37 USD
ตัวอย่างที่ 2 – ประเมินคุณภาพข้อมูลของตารางในแค็ตตาล็อกข้อมูล
หลังจากที่คุณตรวจทานคำแนะนำแล้ว คุณจะสามารถแก้ไขคำแนะนำเหล่านั้นได้หากจำเป็น จากนั้นให้ตั้งกำหนดการของงานคุณภาพข้อมูลโดยการเตรียมใช้งาน DPU ตัวอย่างเช่น ลองพิจารณางานประเมินคุณภาพข้อมูลด้วย 5 DPU ที่มีการดำเนินการเสร็จสิ้นภายใน 20 นาที
คุณจะจ่าย 5 DPU * 1/3 ชั่วโมง * 0.44 USD ซึ่งคิดเป็น 0.73 USD
ตัวอย่างที่ 3 – ประเมินคุณภาพข้อมูลในงาน ETL ของ AWS Glue
นอกจากนี้ คุณยังสามารถเพิ่มการตรวจสอบคุณภาพข้อมูลเหล่านี้ได้ในงาน ETL ของ AWS Glue เพื่อป้องกันไม่ให้ข้อมูลที่ไม่ดีเข้าสู่ Data Lake ของคุณ คุณสามารถทำเช่นนี้ได้โดยการเพิ่มการแปลงคุณภาพข้อมูลบน AWS Glue Studio หรือใช้ API ของ AWS Glue ภายในโค้ดที่คุณเขียนในโน๊ตบุ๊กของ AWS Glue Studio ลองพิจารณาถึงงานของ AWS Glue ที่ทำงานโดยมีการกำหนดค่ากฎคุณภาพข้อมูลภายในไปป์ไลน์ที่มีการดำเนินการ 20 นาที (1/3 ชั่วโมง) โดยใช้ 6 DPU คุณจะถูกเรียกเก็บค่าบริการ 6 DPU * 1/3 ชั่วโมง * 0.44 USD ซึ่งคิดเป็น 0.88 USD หรือคุณสามารถใช้ Flex ซึ่งคุณจะถูกเรียกเก็บค่าบริการ 6 DPU * 1/3 ชั่วโมง * 0.29 USD ซึ่งคิดเป็น 0.58 USD
หมายเหตุ: ราคาอาจแตกต่างกันออกไปในแต่ละ Region
ดูตาราง Region ทั่วโลกเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับความพร้อมใช้งานของ AWS Glue
ข้อมูลราคาเพิ่มเติม
คำนวณต้นทุนรายเดือนอย่างง่ายกับ AWS
ติดต่อผู้เชี่ยวชาญของ AWS เพื่อรับการเสนอราคาแบบส่วนบุคคล
ดูขั้นตอนในการเริ่มต้นใช้งานและเข้าถึงวิดีโอรวมถึงทรัพยากรต่างๆ