- Amazon SageMaker›
- การประมวลผลข้อมูล Amazon SageMaker›
- คำถามที่พบบ่อย
คำถามที่พบบ่อยเกี่ยวกับการประมวลผลข้อมูล Amazon SageMaker
ข้อมูลทั่วไป
การประมวลผลข้อมูล Amazon SageMaker คืออะไร
การประมวลผลข้อมูลของ Amazon SageMaker จะวิเคราะห์ จัดเตรียม และจัดระเบียบข้อมูลของคุณด้วยความสามารถในการประมวลผลจาก Amazon Athena, Amazon EMR, AWS Glue และเวิร์กโฟลว์ที่มีการจัดการของ Amazon สำหรับ Apache Airflow (MWAA) คุณสามารถใช้ประโยชน์จากเฟรมเวิร์กการประมวลผลข้อมูลแบบโอเพนซอร์ส เช่น Apache Spark เพื่อวิเคราะห์ข้อมูลในวงกว้างด้วย Trino และสร้างการวิเคราะห์แบบเรียลไทม์ได้อย่างราบรื่นด้วย Apache Flink และ Apache Spark
บริการใดบ้างที่รวมอยู่ในการประมวลผลข้อมูล Amazon SageMaker
การประมวลผลข้อมูลของ Amazon SageMaker จะรวบรวม Amazon EMR, Amazon Athena, AWS Glue และ Amazon Managed Workflows สำหรับ Apache Airflow เข้าด้วยกัน
เหตุใดฉันจึงควรใช้การประมวลผลข้อมูลของ SageMaker
การประมวลผลข้อมูลของ SageMaker ช่วยให้คุณสำรวจข้อมูล สร้างงานแปลงข้อมูล จัดระเบียบ และปรับใช้ท่อส่งข้อมูลตามขนาดที่ต้องการ ซึ่งช่วยปรับปรุงประสิทธิภาพ ขับเคลื่อนข้อมูลเชิงลึกได้รวดเร็วกว่าระบบโอเพนซอร์สแบบดั้งเดิมด้วยเวอร์ชันของ Apache Spark, Apache Airflow, Apache Flink, Trino และอื่น ๆ ที่คุ้มต้นทุนและเข้ากันได้กับ API โอเพนซอร์ส การประมวลผลข้อมูลช่วยให้คุณเข้าถึงแหล่งที่มาของข้อมูลใน Amazon SageMaker Lakehouse ผ่านการบูรณาการ ETL แบบไร้รอยต่อ ความสามารถในการสืบค้นแบบรวม และตัวเชื่อมต่อ
การโอนย้ายและการเข้าถึง
ฉันจำเป็นต้องโอนย้ายไปยัง Amazon SageMaker เพื่อใช้บริการที่มีอยู่ เช่น Amazon EMR, Amazon Athena หรือ AWS Glue หรือไม่
ไม่ คุณไม่จำเป็นต้องโอนย้ายไปยัง Amazon SageMaker คุณสามารถใช้ Amazon EMR, Amazon Athena, AWS Glue และ Amazon Managed Workflow สำหรับ Apache Airflow ได้ต่อไปเช่นเดียวกับที่คุณทำในปัจจุบัน อย่างไรก็ตาม เราขอแนะนำให้คุณเริ่มต้นใช้งาน Amazon SageMaker เพื่อใช้ประโยชน์จากเครื่องมือ การกำกับดูแลข้อมูลในตัว และสถาปัตยกรรม Amazon SageMaker Lakehouse แบบครบวงจรที่เรียบง่าย
จะเกิดอะไรขึ้นกับงาน การสืบค้น โค้ด และทรัพยากรที่ฉันสร้างขึ้นแล้วหรือวางแผนที่จะสร้างใน Amazon EMR, Amazon Athena หรือ AWS Glue
โค้ด การสืบค้น งาน และทรัพยากรอื่น ๆ ที่คุณสร้างและใช้กับ Amazon EMR, Amazon Athena หรือ AWS Glue ในปัจจุบันจะไม่ได้รับผลกระทบ คุณสามารถใช้ประโยชน์จากบริการเหล่านี้ต่อไปสำหรับเวิร์กโหลดใหม่ได้หากคุณต้องการ ทรัพยากรที่สร้างขึ้นในบริการเหล่านี้ เช่น Amazon EMR บนคลัสเตอร์ EC2 สามารถมองเห็นได้ใน Amazon SageMaker เพื่อลดความซับซ้อนในการพัฒนาแอปพลิเคชันการวิเคราะห์และ AI โดยประสบการณ์การพัฒนาที่มีอยู่ซึ่งสร้างขึ้นใน Amazon EMR, AWS Glue และ Amazon Athena จะยังคงมีอยู่เพิ่มเติมจากประสบการณ์การพัฒนาใหม่ภายใน Amazon SageMaker
Amazon SageMaker มี Glue เวอร์ชันใดบ้าง
AWS Glue เวอร์ชันล่าสุดอย่าง Glue 5.0 มีให้บริการใน Amazon SageMaker แล้ว Glue 5.0 เร่งปริมาณงานการประมวลผลข้อมูลและส่งมอบรันไทม์ Apache Spark 3.5.2 ที่ปรับให้เหมาะสมกับประสิทธิภาพล่าสุดเพื่อให้คุณสามารถพัฒนา เรียกใช้ และปรับขนาดเพื่อข้อมูลเชิงลึกที่รวดเร็วขึ้น หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่ AWS Glue
การกำหนดราคา
รูปแบบการกำหนดราคาสำหรับการประมวลผลข้อมูล Amazon SageMaker คืออะไร
บริการ AWS แต่ละรายการที่คุณใช้ผ่าน Amazon SageMaker นั้นมีการกำหนดราคาแยกต่างหาก หากต้องการดูรายละเอียดเพิ่มเติม โปรดดูหน้าราคา AWS สำหรับ Amazon Athena, Amazon EMR, AWS Glue และเวิร์กโฟลว์ที่มีการจัดการของ Amazon สำหรับ Apache Airflow