อัปเดตคลัสเตอร์ EMR แบบไดนามิกที่กำลังทำงานอยู่ของคุณด้วยการกำหนดค่ากลุ่มอินสแตนซ์ใหม่

โพสต์บน: 17 ก.พ. 2025

Amazon EMR บน EC2 รองรับการอัปเดตการกำหนดค่าแอปพลิเคชันแบบเรียลไทม์สำหรับกลุ่มอินสแตนซ์ EMR โดยไม่ต้องปิดการทำงานของคลัสเตอร์หรือรีสตาร์ต ฟีเจอร์ดังกล่าวช่วยให้ลูกค้าสามารถปรับการกำหนดค่าแอปพลิเคชันแบบไดนามิก เช่น หน่วยความจำการปฏิบัติงานของ Spark, การจัดสรรทรัพยากรของ YARN และการตั้งค่า HDFS ได้อย่างราบรื่นบนคลัสเตอร์ที่กำลังทำงานอยู่ และยังช่วยลดการรบกวนจากเวิร์กโหลดของคุณได้ วิธีนี้มีประโยชน์อย่างยิ่งสำหรับการปรับเปลี่ยนการจัดสรรทรัพยากรและการปรับแต่งแอปพลิเคชันให้ตรงตามข้อกำหนดการประมวลผลข้อมูลและประสิทธิภาพการทำงานขณะเดียวกับที่รับประกันการใช้ทรัพยากรอย่างเหมาะสม

Amazon EMR คือ แพลตฟอร์ม Big Data บนระบบคลาวด์ที่ใช้สำหรับการประมวลผลข้อมูล การวิเคราะห์เชิงโต้ตอบ และแมชชีนเลิร์นนิง โดยใช้กรอบการทำงานแบบโอเพนซอร์ส เช่น Apache Spark, Apache Flink และ Trino ก่อนหน้านี้คุณอาจต้องปิดการทำงานและเปิดคลัสเตอร์กลุ่มอินสแตนซ์ใหม่ด้วยการกำหนดค่าใหม่ กระบวนการนี้ส่งผลให้เกิดช่วงเวลาหยุดทำงาน สิ้นเปลืองพลังงานในการดำเนินงานเพิ่ม และการปรับเปลี่ยนเวิร์กโฟลว์ที่ล่าช้าออกไป ในการสนับสนุนการกำหนดค่าใหม่ EMR จะใช้การกำหนดค่าที่อัปเดตบนโหนดคลัสเตอร์แบบไดนามิกอย่างต่อเนื่อง ขณะเดียวกับที่รับประกันความเสถียรของคลัสเตอร์และความพร้อมใช้งานของทรัพยากร ทั้งยังมีการแจ้งเตือนลูกค้าผ่านกิจกรรม Amazon CloudWatch และ EMR อีกด้วย ในกรณีที่เกิดความล้มเหลวหรือเกิดการอัปเดตที่ไม่เข้ากัน EMR จะย้อนกลับการเปลี่ยนแปลงเพื่อให้แน่ใจว่าคลัสเตอร์ของคุณยังคงทำงานอยู่ คุณสามารถเรียกใช้งานเวิร์กโหลดบนคลัสเตอร์ได้อย่างต่อเนื่องในระหว่างกระบวนการอัปเดต

คุณสามารถใช้ประโยชน์จากฟีเจอร์นี้ได้ใน EMR 5.21 และรุ่นที่ออกใหม่ทั้งหมด โดยใช้ AWS CLI หรือ API ความสามารถนี้พร้อมใช้งานใน AWS Region ทุกแห่ง ซึ่งรวมถึงรีเจี้ยน AWS GovCloud (สหรัฐฯ) ที่มี Amazon EMR บน EC2 ให้บริการ หากต้องการเรียนรู้เพิ่มเติม โปรดดูเอกสารประกอบได้ที่นี่