Amazon EMR Serverless รองรับ Apache Spark 4.0.1 (ตัวอย่าง)

โพสต์บน: 21 พ.ย. 2025

Amazon EMR Serverless รองรับ Apache Spark 4.0.1 (ตัวอย่าง) ด้วย Spark 4.0.1 คุณสามารถสร้างและบำรุงรักษาไปป์ไลน์ได้ง่ายขึ้นด้วยประเภทข้อมูล ANSI SQL และ VARIANT เสริมสร้างกรอบการปฏิบัติตามข้อกำหนดและการกำกับดูแลด้วยรูปแบบตาราง Apache Iceberg v3 และติดตั้งใช้งานแอปพลิเคชันแบบเรียลไทม์ใหม่ได้เร็วขึ้นด้วยความสามารถในการสตรีมที่เพิ่มขึ้น สิ่งนี้ช่วยให้ทีมของคุณสามารถลดหนี้ทางเทคนิคและทำซ้ำได้เร็วขึ้นในขณะที่มั่นใจถึงความถูกต้องและความสม่ำเสมอของข้อมูล

ด้วย Spark 4.0.1 คุณสามารถสร้างไปป์ไลน์ข้อมูลด้วย ANSI SQL มาตรฐาน ทำให้สามารถเข้าถึงผู้ใช้จำนวนมากที่ไม่รู้ภาษาการเขียนโปรแกรม เช่น Python หรือ Scala Spark 4.0.1 รองรับ JSON และข้อมูลกึ่งโครงสร้างแบบดั้งเดิมผ่านประเภทข้อมูล VARIANT ให้ความยืดหยุ่นในการจัดการรูปแบบข้อมูลที่หลากหลาย คุณสามารถเสริมสร้างการปฏิบัติตามข้อกำหนดและการกำกับดูแลผ่านรูปแบบตาราง Apache Iceberg v3 ซึ่งให้การรับประกันการทำธุรกรรมและติดตามการเปลี่ยนแปลงข้อมูลของคุณเมื่อเวลาผ่านไป สร้างเส้นทางการตรวจสอบที่คุณต้องการสำหรับข้อกำหนดด้านกฎระเบียบ คุณสามารถติดตั้งใช้งานแอปพลิเคชันแบบเรียลไทม์ได้เร็วขึ้นด้วยการควบคุมการสตรีมที่ดีขึ้นซึ่งช่วยให้คุณจัดการการดำเนินการตามสถานะที่ซับซ้อนและตรวจสอบงานสตรีมได้ง่ายขึ้น ด้วยความสามารถนี้คุณสามารถสนับสนุนกรณีการใช้งานเช่นการตรวจจับการโกงและการปรับแต่งแบบเรียลไทม์

Apache Spark 4.0.1 มีให้ดูตัวอย่างในทุกรีเจี้ยนที่ EMR แบบไม่ต้องใช้เซิร์ฟเวอร์พร้อมใช้งาน ยกเว้นรีเจี้ยนจีนและ AWS GovCloud (สหรัฐฯ) หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Apache Spark 4.0.1 บน Amazon EMR โปรดไปที่บันทึกการอัปเดต Amazon EMR Serverless หรือเริ่มต้นด้วยการสร้างแอปพลิเคชัน EMR ด้วย Spark 4.0.1 จากคอนโซลการจัดการของ AWS