Gunakan Apache Spark di Amazon EMR Nirserver langsung dari Amazon Sagemaker Studio
Anda sekarang dapat menjalankan analitik data skala petabyte dan machine learning di Amazon EMR Nirserver langsung dari notebook Amazon SageMaker Studio. EMR Nirserver secara otomatis menyediakan dan menskalakan sumber daya yang diperlukan, memungkinkan Anda untuk fokus pada data dan model tanpa harus mengkonfigurasi, mengoptimalkan, menyetel, atau mengelola klaster. EMR Nirserver secara otomatis menginstal dan mengonfigurasi kerangka kerja open source dan menyediakan runtime yang dioptimalkan kinerja yang kompatibel dengan dan lebih cepat dari open source standar.
Dengan rilis ini, Anda sekarang dapat secara visual membuat dan menelusuri aplikasi EMR Nirserver langsung dari SageMaker Studio dan menghubungkannya dengan beberapa klik sederhana. Setelah terhubung ke aplikasi EMR Nirserver, Anda dapat menggunakan Spark SQL, Scala, Python untuk secara interaktif menanyakan, menjelajahi dan memvisualisasikan data, dan menjalankan tugas Apache Spark untuk memproses data langsung dari Studio Notebooks. Pekerjaan berjalan cepat karena mereka menggunakan versi Spark yang dioptimalkan kinerja EMR. Misalnya Spark pada EMR 7.1 4,5x lebih cepat daripada yang setara dengan open source. EMR Nirserver menawarkan penskalaan otomatis berbutir halus, yang menyediakan dan dengan cepat menskalakan sumber daya komputasi dan memori agar sesuai dengan persyaratan aplikasi Anda dan Anda hanya membayar untuk apa yang Anda gunakan.
Fitur-fitur ini didukung di SageMaker Distribution 1.10 ke atas, dan umumnya tersedia di semua AWS Region tempat SageMaker Studio tersedia. Untuk mempelajari lebih lanjut, baca blog Gunakan LangChain dengan PySpark untuk Memproses dokumen dalam skala besar dengan Amazon SageMaker Studio dan EMR Nirserver, atau dokumentasi SageMaker Studio di sini.