Publié le: Jun 1, 2022
Nous avons le plaisir d'annoncer la disponibilité générale d'Amazon EMR Serverless, une nouvelle option de déploiement sans serveur dans Amazon EMR qui permet aux ingénieurs et analystes de données d'exécuter facilement et à moindre coût des analyses de données à l'échelle du pétaoctet dans le cloud. Amazon EMR est une solution de big data que vous pouvez utiliser pour exécuter des tâches de traitement de données distribuées à grande échelle, des requêtes SQL interactives et des applications de machine learning (ML) créées sur des cadres analytiques open-source tels que Apache Spark, Apache Hive et Presto. Avec EMR Serverless, vous pouvez exécuter vos applications Spark et Hive sans avoir à configurer, optimiser, régler ou gérer de clusters.
EMR Serverless offre une mise à l'échelle automatique fine, qui fournit et met rapidement à l'échelle les ressources de calcul et de mémoire requises par l'application. Par exemple, si une tâche Spark a besoin de 2 exécuteurs pendant les 5 premières minutes, de 10 exécuteurs pendant les 10 minutes suivantes et de 5 exécuteurs pendant les 20 dernières minutes, EMR Serverless fournit automatiquement les ressources selon les besoins et vous ne payez que les ressources utilisées. EMR Serverless comprend également le moteur d'exécution EMR optimisé pour les performances afin que vos tâches s'exécutent rapidement. En outre, EMR Serverless s'intègre à EMR Studio pour vous fournir des outils complets permettant de vérifier l'état des tâches en cours, d'examiner l'historique des tâches et d'utiliser des outils open-source familiers pour déboguer les tâches.
Amazon EMR Serverless est généralement disponible dans quatre Régions : USA Est (Virginie du Nord), USA Ouest (Oregon), Asie-Pacifique (Tokyo) et EU (Irlande).
Cliquez ici pour lire l'article du blog EMR Serverless, et consultez la documentation EMR Serverless pour plus de détails.