Publié le: Nov 30, 2021

Nous avons le plaisir d'annoncer la disponibilité de la version de prévisualisation d'Amazon EMR Serverless, une nouvelle option sans serveur dans Amazon EMR qui permet aux ingénieurs et analystes des données d'exécuter facilement et à moindre coût des tâches d'analytique des données à l'échelle du pétaoctet dans le cloud. Amazon EMR est une plateforme de big data dans le cloud utilisée par les clients pour exécuter des tâches de traitement de données distribuées à grande échelle, des requêtes SQL interactives et des applications de machine learning à l'aide de cadres d'analytique open source tels que Apache Spark, Apache Hive et Presto. Les clients de EMR Serverless peuvent exécuter en quelques clics des applications conçues à l'aide de ces cadres d'analytique, sans avoir à configurer, optimiser ou sécuriser les clusters. Enfin, elle alloue et adapte automatiquement les ressources de calcul et de mémoire requises par l'application. Ainsi, les clients ne paient que les ressources qu'ils ont effectivement utilisées.

EMR Serverless vous permet de spécifier simplement le cadre open source et la version que vous souhaitez utiliser pour votre application, et d'envoyer des tâches à l'aide d'API, d'EMR Studio ou de clients JDBC/ODBC. De plus, il identifie et alloue automatiquement les ressources de calcul et de mémoire nécessaires au traitement des demandes, et met à l'échelle les ressources aux différentes étapes du traitement en fonction de l'évolution des besoins. Par exemple, pour traiter vos données, une tâche Spark peut avoir besoin de deux exécuteurs pendant les 5 premières minutes, de dix exécuteurs pendant les 10 minutes suivantes et de cinq exécuteurs pendant les 20 dernières minutes.  EMR Serverless alloue et ajuste automatiquement les ressources en fonction des besoins, de sorte que vous n'avez pas à vous inquiéter lorsque les volumes de données évoluent dans le temps. En revanche, puisque vous ne payez que les ressources utilisées, EMR Serverless est rentable pour l'exécution de l'analytique à l'échelle du pétaoctet. Les clients peuvent vérifier l'état des tâches en cours, consulter leur historique et utiliser des outils open source familiers pour déboguer les tâches à l'aide d'EMR Studio.

Amazon EMR Serverless est disponible en version de prévisualisation dans la région USA Est (Virginie du Nord). Cliquez ici pour vous inscrire afin d'avoir accès à la version de prévisualisation, parcourir le blog et consulter la documentation pour plus de détails.