ข้ามไปที่เนื้อหาหลัก

การประมวลผลข้อมูล Amazon SageMaker

คำถามที่พบบ่อยเกี่ยวกับการประมวลผลข้อมูล Amazon SageMaker

ข้อมูลทั่วไป

เปิดทั้งหมด

การประมวลผลข้อมูลของ SageMaker จะวิเคราะห์ จัดเตรียม และจัดระเบียบข้อมูลของคุณด้วยความสามารถในการประมวลผลจาก Amazon Athena, Amazon EMR, AWS Glue และ Amazon Managed Workflows สำหรับ Apache Airflow (Amazon MWAA) คุณสามารถใช้เฟรมเวิร์กการประมวลผลข้อมูลแบบโอเพนซอร์ส เช่น Apache Spark เพื่อวิเคราะห์ข้อมูลในวงกว้างด้วย Trino และสร้างการวิเคราะห์แบบเรียลไทม์ได้อย่างราบรื่นด้วย Apache Flink และ Apache Spark

การประมวลผลข้อมูล SageMaker นำ Amazon EMR, Athena, AWS Glue และ Amazon MWAA มารวมกัน

การประมวลผลข้อมูลของ SageMaker ช่วยให้คุณสำรวจข้อมูล สร้างงานแปลงข้อมูล จัดระเบียบ และปรับใช้ท่อส่งข้อมูลตามขนาดที่ต้องการ ซึ่งช่วยปรับปรุงประสิทธิภาพ ขับเคลื่อนข้อมูลเชิงลึกได้รวดเร็วกว่าระบบโอเพนซอร์สแบบดั้งเดิมด้วยเวอร์ชันของ Apache Spark, Apache Airflow, Apache Flink, Trino และอื่น ๆ ที่คุ้มต้นทุนและเข้ากันได้กับ API โอเพนซอร์ส การประมวลผลข้อมูล SageMaker ช่วยให้คุณเข้าถึงแหล่งที่มาของข้อมูลใน Amazon SageMaker Lakehouse ผ่านกการบูรณาการ ETL แบบไร้รอยต่อ ความสามารถในการสืบค้นแบบรวม และตัวเชื่อมต่อ

การย้ายและการเข้าถึง

เปิดทั้งหมด

ไม่ คุณไม่จำเป็นต้องย้ายไปยัง SageMaker คุณสามารถใช้ Amazon EMR, Athena, AWS Glue และ Amazon MWAA ต่อไปได้เหมือนเช่นปัจจุบัน อย่างไรก็ตาม เราขอแนะนำให้คุณเริ่มต้นใช้งาน Amazon SageMaker เพื่อใช้เครื่องมือ การกำกับดูแลข้อมูลในตัว และสถาปัตยกรรม SageMaker Lakehouse แบบครบวงจรที่เรียบง่าย

โค้ด การสืบค้น งาน และทรัพยากรอื่น ๆ ที่คุณสร้างและใช้กับ Amazon EMR, Athena หรือ AWS Glue ในปัจจุบันจะไม่ได้รับผลกระทบ คุณสามารถใช้บริการเหล่านี้ต่อไปสำหรับเวิร์กโหลดใหม่ได้หากคุณต้องการ ทรัพยากรที่สร้างขึ้นในบริการเหล่านี้ เช่น Amazon EMR บนคลัสเตอร์ Amazon Elastic Compute Cloud (Amazon EC2) สามารถมองเห็นได้ใน SageMaker เพื่อลดความซับซ้อนในการพัฒนาแอปพลิเคชันการวิเคราะห์และ AI โดยประสบการณ์การพัฒนาที่มีอยู่ซึ่งสร้างขึ้นใน Amazon EMR, AWS Glue และ Athena จะยังคงมีอยู่เพิ่มเติมจากประสบการณ์การพัฒนาใหม่ภายใน SageMaker

AWS Glue เวอร์ชันล่าสุดอย่าง AWS Glue 5.0 มีให้บริการใน SageMaker แล้ว AWS Glue 5.0 เร่งเวิร์กโหลดการประมวลผลข้อมูลและส่งมอบรันไทม์ Apache Spark 3.5.2 ที่ปรับให้เหมาะสมกับประสิทธิภาพล่าสุดเพื่อให้คุณสามารถพัฒนา เรียกใช้ และปรับขนาดเพื่อข้อมูลเชิงลึกที่รวดเร็วขึ้น หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่ AWS Glue

บริการ AWS แต่ละรายการที่คุณใช้ผ่าน SageMaker นั้นมีการกำหนดราคาแยกต่างหาก สำหรับรายละเอียดเพิ่มเติม โปรดดูหน้าราคา AWS สำหรับ Athena, Amazon EMR, AWS G lue และ Amazon MWAA