Publié le: Nov 28, 2023
Vous pouvez désormais accélérer le traitement et l'analyse des données avec les applications Apache Spark jusqu'à 4 fois par rapport aux données de S3 Standard avec Amazon EMR et la classe de stockage Amazon S3 Express One Zone. S3 Express One Zone est une classe de stockage hautes performances associée à une seule zone de disponibilité. Elle a été conçue pour offrir un accès homogène, de l'ordre de la milliseconde, aux données les plus fréquemment consultées et aux applications sensibles à la latence.
Amazon EMR est la solution big data dans le cloud de pointe pour le traitement des données, l'analyse interactive et le machine learning sur des frameworks open source optimisés à l'échelle du pétaoctet sur AWS. Si vos charges de travail critiques en termes de performances sont soumises à des accords de niveau de service (SLA), par exemple pour respecter les délais d'exécution des tâches pour les mises à jour des lacs de données, ou si vous avez besoin d'un temps de réponse rapide pour les rapports de tableau de bord BI, utilisez S3 Express One Zone lorsque vous exécutez des applications EMR Spark sur un cluster EC2.
S3 Express One Zone est disponible avec la version 6.15.0 d'Amazon EMR dans les régions AWS où S3 Express One Zone est disponible. Pour commencer, déplacez vos données vers le stockage S3 Express One Zone et utilisez le connecteur S3a dans votre code Spark pour lire et écrire des données. Le connecteur S3a est utilisé par EMR pour traiter les objets S3. Il est requis avec les compartiments S3 Express One Zone. Pour en savoir plus, consultez la section Utilisation d'EMR avec des données dans S3 Express One Zone dans la documentation relative à Amazon EMR.