Inserito il: Dec 22, 2017

Ora puoi utilizzare Apache Spark 2.2.1, Apache Hive 2.3.2 e l'integrazione Amazon SageMaker con Apache Spark su Amazon EMR release 5.11.0. Spark 2.2.1 e Hive 2.3.2 includono diverse correzioni di bug e miglioramenti. Amazon SageMaker Spark è una biblioteca Spark open source per Amazon SageMaker, un servizio completamente gestito in grado di creare, formare e distribuire modelli di machine learning scalabili. Consente di eseguire l'interleaving delle diverse fasi Spark che interagiscono con Amazon SageMaker nelle pipeline ML Spark, permettendo di formare modelli utilizzando frame di dati Spark DataFrames in Amazon SageMaker con algoritmi ML forniti da Amazon, come clustering K-Means o XGBoost.

Con la release 5.11.0 puoi creare un cluster Amazon EMR scegliendo l'etichetta "emr-5.11.0" dalla Console di gestione AWS, da AWS CLI o da SDK. Puoi selezionare Spark e Hive per installare queste applicazioni sul tuo cluster. La biblioteca Amazon SageMaker Spark viene inclusa automaticamente quando si installa Spark. Consulta la documentazione relativa ad Amazon EMR per ulteriori informazioni su release 5.11.0, Spark 2.2.1, Hive 2.3.2 e sull'utilizzo di Amazon SageMaker con Spark

Amazon EMR release 5.11.0 è disponibile in tutte le regioni supportate per Amazon EMR