- Amazon SageMaker›
- การประมวลผลข้อมูล Amazon SageMaker›
- คำถามที่พบบ่อย
คำถามที่พบบ่อยเกี่ยวกับการประมวลผลข้อมูล Amazon SageMaker
หัวข้อของหน้า
ข้อมูลทั่วไป
เปิดทั้งหมดการประมวลผลข้อมูลของ SageMaker จะวิเคราะห์ จัดเตรียม และจัดระเบียบข้อมูลของคุณด้วยความสามารถในการประมวลผลจาก Amazon Athena, Amazon EMR, AWS Glue และ Amazon Managed Workflows สำหรับ Apache Airflow (Amazon MWAA) คุณสามารถใช้เฟรมเวิร์กการประมวลผลข้อมูลแบบโอเพนซอร์ส เช่น Apache Spark เพื่อวิเคราะห์ข้อมูลในวงกว้างด้วย Trino และสร้างการวิเคราะห์แบบเรียลไทม์ได้อย่างราบรื่นด้วย Apache Flink และ Apache Spark
การประมวลผลข้อมูล SageMaker นำ Amazon EMR, Athena, AWS Glue และ Amazon MWAA มารวมกัน
การประมวลผลข้อมูลของ SageMaker ช่วยให้คุณสำรวจข้อมูล สร้างงานแปลงข้อมูล จัดระเบียบ และปรับใช้ท่อส่งข้อมูลตามขนาดที่ต้องการ ซึ่งช่วยปรับปรุงประสิทธิภาพ ขับเคลื่อนข้อมูลเชิงลึกได้รวดเร็วกว่าระบบโอเพนซอร์สแบบดั้งเดิมด้วยเวอร์ชันของ Apache Spark, Apache Airflow, Apache Flink, Trino และอื่น ๆ ที่คุ้มต้นทุนและเข้ากันได้กับ API โอเพนซอร์ส การประมวลผลข้อมูล SageMaker ช่วยให้คุณเข้าถึงแหล่งที่มาของข้อมูลใน Amazon SageMaker Lakehouse ผ่านกการบูรณาการ ETL แบบไร้รอยต่อ ความสามารถในการสืบค้นแบบรวม และตัวเชื่อมต่อ
การย้ายและการเข้าถึง
เปิดทั้งหมดไม่ คุณไม่จำเป็นต้องย้ายไปยัง SageMaker คุณสามารถใช้ Amazon EMR, Athena, AWS Glue และ Amazon MWAA ต่อไปได้เหมือนเช่นปัจจุบัน อย่างไรก็ตาม เราขอแนะนำให้คุณเริ่มต้นใช้งาน Amazon SageMaker เพื่อใช้เครื่องมือ การกำกับดูแลข้อมูลในตัว และสถาปัตยกรรม SageMaker Lakehouse แบบครบวงจรที่เรียบง่าย
โค้ด การสืบค้น งาน และทรัพยากรอื่น ๆ ที่คุณสร้างและใช้กับ Amazon EMR, Athena หรือ AWS Glue ในปัจจุบันจะไม่ได้รับผลกระทบ คุณสามารถใช้บริการเหล่านี้ต่อไปสำหรับเวิร์กโหลดใหม่ได้หากคุณต้องการ ทรัพยากรที่สร้างขึ้นในบริการเหล่านี้ เช่น Amazon EMR บนคลัสเตอร์ Amazon Elastic Compute Cloud (Amazon EC2) สามารถมองเห็นได้ใน SageMaker เพื่อลดความซับซ้อนในการพัฒนาแอปพลิเคชันการวิเคราะห์และ AI โดยประสบการณ์การพัฒนาที่มีอยู่ซึ่งสร้างขึ้นใน Amazon EMR, AWS Glue และ Athena จะยังคงมีอยู่เพิ่มเติมจากประสบการณ์การพัฒนาใหม่ภายใน SageMaker
AWS Glue เวอร์ชันล่าสุดอย่าง AWS Glue 5.0 มีให้บริการใน SageMaker แล้ว AWS Glue 5.0 เร่งเวิร์กโหลดการประมวลผลข้อมูลและส่งมอบรันไทม์ Apache Spark 3.5.2 ที่ปรับให้เหมาะสมกับประสิทธิภาพล่าสุดเพื่อให้คุณสามารถพัฒนา เรียกใช้ และปรับขนาดเพื่อข้อมูลเชิงลึกที่รวดเร็วขึ้น หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่ AWS Glue
ราคา
เปิดทั้งหมดบริการ AWS แต่ละรายการที่คุณใช้ผ่าน SageMaker นั้นมีการกำหนดราคาแยกต่างหาก สำหรับรายละเอียดเพิ่มเติม โปรดดูหน้าราคา AWS สำหรับ Athena, Amazon EMR, AWS G lue และ Amazon MWAA