Inserito il: Nov 6, 2019

Ora puoi eseguire il debug e il monitoraggio delle attività Apache Spark effettuando l'accesso diretto al server cronologia Apache Spark persistente e fuori cluster usando la console EMR.  

Il server cronologia Spark è un'estensione dell'interfaccia utente (UI) Web di Apache Spark. Questo strumento presenta un'interfaccia visiva con informazioni dettagliate sulle attività Spark completate e in esecuzione su un cluster. Puoi esaminare i parametri specifici di un lavoro e le informazioni su fasi di pianificazione, attività e processi in esecuzione.  

Amazon EMR ora supporta il server cronologia Spark insieme ai log evento e container al di fuori del cluster e indipendentemente dal suo ciclo di vita. Questo ti consente di accedere al server cronologia Spark e di usarlo sia per i cluster terminati sia per quelli in esecuzione. Inoltre, puoi accedere al server cronologia Spark direttamente dalla console, senza più dover attraversare le complesse fasi per visualizzarlo come interfaccia Web.

La funzionalità è disponibile se si usa EMR nella versione 5.25 o successiva e nelle seguenti regioni: Stati Uniti orientali (Virginia settentrionale e Ohio), Stati Uniti occidentali (California settentrionale e Oregon), Canada (Centrale), UE (Francoforte, Irlanda e Londra) e Asia Pacifico (Mumbai, Seul, Singapore, Sydney e Tokyo).