Amazon EMR annonce S3A comme connecteur par défaut

Publié le: 29 août 2025

AWS annonce Amazon EMR S3A, un nouveau connecteur Amazon S3 qui optimise les performances des charges de travail Apache Hadoop, Apache Spark et Apache Hive sur Amazon EMR. Ce nouveau connecteur améliore l'architecture open source S3A grâce à des optimisations spécifiques à AWS afin d'aider les entreprises à traiter les données à grande échelle de manière plus efficace. Grâce à la prise en charge directe de l'intégration à S3 Express One Zone, S3 Glacier et AWS Outposts, EMR S3A aide les clients à tirer parti des différentes options de stockage dans AWS afin d'optimiser à la fois la vitesse d'accès aux données et les coûts de stockage de leurs charges de travail EMR.

En outre, le connecteur EMR S3A fournit des fonctionnalités de sécurité avancées et des capacités de performance qui vont au-delà du S3A open source. Les principales améliorations incluent la prise en charge du contrôle d'accès précis intégré à Apache Spark, un résolveur d'informations d'identification S3A amélioré, MagicCommitter V2 pour une écriture de fichiers optimisée et une liste accélérée des préfixes S3 pour les formats de fichiers en colonnes. Ces améliorations sont disponibles à partir de la version 7.10 d'EMR et garantissent la compatibilité avec les applications existantes.


Le connecteur Amazon EMR S3A est disponible dans toutes les régions AWS où Amazon EMR est disponible et est préconfiguré avec les versions 7.10 et ultérieures d'Amazon EMR. Pour en savoir plus sur Amazon EMR S3A, consultez la documentation relative à Amazon EMR.