Amazon EMR Nirserver sekarang mendukung Apache Spark 4.0.1 (pratinjau)
Amazon EMR Nirserver sekarang mendukung Apache Spark 4.0.1 (pratinjau). Dengan Spark 4.0.1, Anda dapat membangun dan memelihara pipeline data dengan lebih mudah dengan tipe data ANSI SQL dan VARIANT, memperkuat kerangka kerja kepatuhan dan tata kelola dengan format tabel Apache Iceberg v3, dan men-deploy aplikasi real-time baru lebih cepat dengan kemampuan streaming yang ditingkatkan. Hal ini memungkinkan tim Anda mengurangi utang teknis dan melakukan iterasi lebih cepat, sekaligus memastikan akurasi dan konsistensi data.
Dengan Spark 4.0.1, Anda dapat membangun pipeline data dengan ANSI SQL standar, sehingga dapat diakses oleh kumpulan pengguna yang lebih besar yang tidak tahu bahasa pemrograman seperti Python atau Scala. Spark 4.0.1 secara native mendukung JSON dan data semi-terstruktur melalui tipe data VARIANT, memberikan fleksibilitas untuk menangani beragam format data. Anda dapat memperkuat kepatuhan dan tata kelola melalui format tabel Apache Iceberg v3, yang memberikan jaminan transaksi dan melacak bagaimana data Anda berubah dari waktu ke waktu, menciptakan jejak audit yang Anda butuhkan untuk persyaratan peraturan. Anda dapat men-deploy aplikasi real-time lebih cepat dengan kontrol streaming yang ditingkatkan yang memungkinkan Anda mengelola operasi stateful yang kompleks dan memantau pekerjaan streaming dengan lebih mudah. Dengan kemampuan ini, Anda dapat mendukung kasus penggunaan seperti deteksi penipuan dan personalisasi real-time.
Apache Spark 4.0.1 tersedia dalam pratinjau di semua region tempat EMR Nirserver tersedia, tidak termasuk region Tiongkok dan AWS GovCloud (AS). Untuk mempelajari lebih lanjut tentang Apache Spark 4.0.1 di Amazon EMR, kunjungi catatan rilis Amazon EMR Nirserver, atau mulailah dengan membuat aplikasi EMR dengan Spark 4.0.1 dari Konsol Manajemen AWS.