- Analisi›
- Amazon EMR›
- EMR serverless
Amazon EMR serverless
Esegui applicazioni di big data utilizzando framework open source senza bisogno di gestire cluster e server
Perché utilizzare EMR serverless?
Amazon EMR serverless è un'opzione serverless disponibile in Amazon EMR, che consente ad analisti e data engineer di eseguire facilmente framework di analisi dei big data open source senza configurare, gestire e scalare cluster o server. Ottieni tutte le funzionalità e i vantaggi di Amazon EMR senza dover ricorrere a esperti per la pianificazione e la gestione dei cluster.
Vantaggi
Con l'agente di aggiornamento Apache Spark, gli aggiornamenti di Apache Spark della durata di mesi si trasformano in progetti efficienti della durata di una settimana tramite l'automazione intelligente. L'agente di aggiornamento Spark semplifica le migrazioni aziendali gestendo automaticamente modifiche complesse alle API in tutta la base di codice, riducendo drasticamente costi e sforzi.
Amazon EMR serverless elimina il provisioning dell'archiviazione locale per i carichi di lavoro Apache Spark, riducendo i costi di elaborazione dei dati fino al 20% ed evitando gli errori dei processi dovuti ai vincoli di capacità del disco. EMR serverless gestisce automaticamente le operazioni intermedie sui dati, ad esempio lo shuffle, senza costi di archiviazione: si paga solo per le risorse di calcolo e memoria.
Come funziona
1
Crea la tua applicazione
Scegli il framework open source e la versione che desideri utilizzare.
2
Invia i processi
Invia processi alla tua applicazione tramite le API o EMR Studio. Puoi anche inviare i processi utilizzando servizi di orchestrazione dei flussi di lavoro come Apache Airflow o flussi di lavoro gestiti da Amazon per Apache Airflow.
3
Processi di debug
Usa strumenti open source familiari come Spark UI e Tez UI per monitorare ed eseguire il debug dei processi.