ค่าบริการของ SageMaker Lakehouse

Amazon SageMaker Lakehouse รวมข้อมูลทั้งหมดของคุณใน Data Lake ของ Amazon Simple Storage Service (Amazon S3) และคลังข้อมูล Amazon Redshift ซึ่งช่วยให้คุณสร้างการวิเคราะห์และแอปพลิเคชัน AI/ML ที่มีประสิทธิภาพบนสำเนาข้อมูลเดียว SageMaker Lakehouse ให้ความยืดหยุ่นในการเข้าถึงและสืบค้นข้อมูลของคุณด้วยเครื่องมือที่ใช้งานร่วมกันได้กับ Apache Iceberg และเครื่องมืออื่น ๆ ทั้งหมด โดยจะรักษาความปลอดภัยข้อมูลของคุณใน Lakehouse ด้วยการปรับแต่งสิทธิ์แบบละเอียด ซึ่งจะมีการนำไปใช้กับทั่วทุกเครื่องมือและกลไกการวิเคราะห์และแมชชีนเลิร์นนิง (ML) อย่างสอดคล้องกัน นอกเหนือจากประโยชน์เหล่านี้แล้ว คุณยังสามารถเข้าถึงข้อมูลของคุณจากฐานข้อมูลและแอปพลิเคชันด้านการดำเนินงานผ่านการบูรณาการ ETL แบบไร้รอยต่อและข้อมูลทั่วทั้งแหล่งที่มาของบุคคลที่สามผ่านความสามารถในการสืบค้นที่เชื่อมโยงกับส่วนกลางใน Lakehouse

Amazon SageMaker Lakehouse สามารถเข้าถึงได้โดยตรงจากสตูดิโอแบบครบวงจรของ Amazon SageMaker (เวอร์ชันทดลองใช้) ข้อมูลจากแหล่งต่าง ๆ จะได้รับการจัดระเบียบไว้ในคอนเทนเนอร์เชิงตรรกะที่เรียกว่าแค็ตตาล็อกใน SageMaker Lakehouse แต่ละแค็ตตาล็อกแสดงข้อมูลจากแหล่งที่มาของข้อมูลที่มีอยู่ เช่น คลังข้อมูล และฐานข้อมูลของบุคคลที่สาม หรือสร้างโดยตรงใน Lakehouse เพื่อจัดเก็บข้อมูลใน Amazon S3 หรือ Amazon Redshift Managed Storage (RMS) กลไกสืบค้นสามารถเชื่อมต่อกับแค็ตตาล็อกเหล่านี้และเข้าถึงข้อมูลในสถานที่ด้วย Apache Iceberg API ได้ คุณสามารถใช้กลไกที่เข้ากันได้กับที่ใช้งานร่วมกันกับ Apache Iceberg ได้ เช่น Apache Spark, Trino, Amazon Athena หรือ Amazon EMR เพื่อเข้าถึงข้อมูลในรูปแบบตาราง Apache Iceberg และสืบค้นข้อมูลจากกลไกสืบค้นของบุคคลที่หนึ่งและบุคคลที่สาม ในทำนองเดียวกัน แค็ตตาล็อกจะถูกติดตั้งไว้ในกลไกสืบค้นของบุคคลที่หนึ่ง เช่น คลัสเตอร์ Amazon Redshift และเวิร์กกรุ๊ปในรูปแบบฐานข้อมูล เชื่อมต่อกับฐานข้อมูลจากเครื่องมือสืบค้นผ่าน Java Database Connectivity (JDBC) หรือเครื่องมือแก้ไขการสืบค้นข้อมูลของ Amazon Redshift V2 เพื่อสืบค้นโดยใช้ SQL

ราคาของ SageMaker Lakehouse

SageMaker Lakehouse มีองค์ประกอบพื้นฐานดังต่อไปนี้ จะมีค่าใช้จ่ายสำหรับองค์ประกอบที่คุณใช้ใน Lakehouse

ข้อมูลเมตาของ SageMaker Lakehouse: คำจำกัดความของข้อมูลจะได้รับการจัดระเบียบไว้ในลำดับชั้นเชิงตรรกะของแค็ตตาล็อก ฐานข้อมูล และตารางโดยใช้แค็ตตาล็อกข้อมูลของ AWS Glue

  • แค็ตตาล็อก: คอนเทนเนอร์เชิงตรรกะที่เก็บวัตถุจากที่เก็บข้อมูล เช่น สคีมา ตาราง มุมมอง หรือมุมมองผลการสืบค้นจาก Amazon Redshift คุณสามารถซ้อนแค็ตตาล็อกไว้ภายใต้แคตตาล็อกเพื่อให้ตรงกับระดับลำดับชั้นจากแหล่งที่มาของข้อมูลที่คุณนำไปที่ Lakehouse
  • ฐานข้อมูล: สามารถใช้ฐานข้อมูลในการจัดระเบียบอ็อบเจกต์ข้อมูล เช่น ตารางและมุมมองใน Lakehouse
  • ตารางและมุมมอง: ตารางและมุมมองเป็นอ็อบเจกต์ข้อมูลในฐานข้อมูลที่อธิบายวิธีเข้าถึงข้อมูลพื้นฐาน เช่น สคีมา พาร์ติชัน ตำแหน่งที่จัดเก็บข้อมูล รูปแบบการจัดเก็บ และการสืบค้น SQL เพื่อเข้าถึงข้อมูล

ข้อมูลเมตาของ SageMaker Lakehouse สามารถเข้าถึงได้จาก AWS Glue API การจัดเก็บข้อมูลเมตาและคำขอ API จะเป็นไปตามราคาข้อมูลเมตาในแค็ตตาล็อกข้อมูลของ AWS Glue ซึ่งรวมถึง AWS Free Tier ด้วย ดูข้อมูลเพิ่มเติมได้ที่ ราคาของ AWS Glue

พื้นที่เก็บข้อมูลและการเข้าถึง: เมื่อใช้ SageMaker Lakehouse คุณจะสามารถอ่านและเขียนข้อมูลลงใน Amazon S3 หรือ RMS ได้ จะมีค่าใช้จ่ายในการประมวลผลและจัดเก็บข้อมูลเพิ่มเติมสำหรับการเข้าถึงพื้นที่เก็บข้อมูลพื้นฐาน ทั้งนี้จะขึ้นอยู่กับประเภทการจัดเก็บที่คุณเลือกจัดเก็บข้อมูลไว้ใน Lakehouse ดูรายละเอียดเพิ่มเติมเกี่ยวกับราคาพื้นที่เก็บข้อมูลและการประมวลผลสำหรับการจัดเก็บประเภทต่าง ๆ ได้ที่ราคาของ AWS Glue

การบำรุงรักษาตาราง Apache Iceberg และสถิติ: ใน SageMaker Lakehouse คุณสามารถทำให้การเก็บรวบรวมสถิติเกี่ยวกับตาราง Data Lake ใน Amazon S3 เป็นระบบอัตโนมัติ เพื่อให้การดำเนินการสืบค้นและการบำรุงรักษาตาราง Apache Iceberg เร็วขึ้น เช่น การบีบอัด ซึ่งจะช่วยเพิ่มประสิทธิภาพเค้าโครงการจัดเก็บของตาราง Apache Iceberg จะมีค่าบริการเพิ่มเติมเมื่อคุณเปิดใช้งานฟีเจอร์เหล่านี้ ดูข้อมูลเพิ่มเติมได้ที่ ราคาของ AWS Glue

สิทธิ์: สิทธิ์แบบละเอียดใน SageMaker Lakehouse ได้รับการขับเคลื่อนโดย AWS Lake Formation สิทธิ์ใน SageMaker Lakehouse ไม่มีค่าใช้จ่าย ดูรายละเอียดเพิ่มเติมได้ที่ราคาของ Lake Formation

ค่าใช้จ่ายการบูรณาการ ETL แบบไร้รอยต่อ

SageMaker มีการบูรณาการ ETL แบบไร้รอยต่อกับแอปพลิเคชัน ซึ่งจะขจัดความจำเป็นในการสร้างและจัดการไปป์ไลน์กระบวนการ Extract, Transform and Load (ETL) แอปพลิเคชันที่รองรับ ได้แก่ Salesforce, ServiceNow, Zendesk และอื่น ๆ

การผสานรวมเหล่านี้ช่วยให้คุณมีความยืดหยุ่น คุณจึงสามารถเลือกตารางข้อมูลที่เฉพาะเจาะจงในแอปพลิเคชันเพื่อจำลองไปยัง Amazon Redshift โดยอัตโนมัติ ความยืดหยุ่นนี้ทำให้คุณสามารถเรียกใช้การวิเคราะห์แบบครบวงจรกับแอปพลิเคชันและแหล่งที่มาของข้อมูลต่าง ๆ ได้ AWS ไม่เรียกเก็บค่าธรรมเนียมเพิ่มเติมสำหรับการบูรณาการ ETL แบบไร้รอยต่อ คุณจะจ่ายค่าทรัพยากรที่มีอยู่ที่ใช้ในการสร้างและประมวลผลข้อมูลการเปลี่ยนแปลงที่สร้างขึ้นโดยเป็นส่วนหนึ่งของการบูรณาการ ETL แบบไร้รอยต่อ ซึ่งรวมถึงพื้นที่เก็บข้อมูล Amazon Redshift เพิ่มเติมสำหรับการจัดเก็บข้อมูลจำลอง ทรัพยากรการประมวลผลสำหรับการประมวลผลการจำลองข้อมูล (หรือ RPU บน Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์) และค่าใช้จ่ายในการถ่ายโอนข้อมูล Cross-AZ สำหรับการย้ายข้อมูลจากต้นทางไปยังเป้าหมาย การประมวลผลการเปลี่ยนแปลงข้อมูลอย่างต่อเนื่องโดยการบูรณาการ ETL แบบไร้รอยต่อจะไม่มีค่าใช้จ่ายเพิ่มเติม ดูข้อมูลเพิ่มเติมได้ที่ราคาของ Amazon Aurora ราคา Amazon Relational Database (Amazon RDS) สำหรับ MySQL ราคาของ Amazon DynamoDB และ AWS Glue