Publié le: Sep 5, 2018
Amazon S3 annonce des améliorations de fonctionnalités pour S3 Select. S3 Select est une fonctionnalité Amazon S3 conçue pour n'extraire que les données dont vous avez besoin d'un objet, ce qui améliore de façon spectaculaire les performances et réduit le coût des applications qui doivent accéder aux données dans S3.
Aujourd’hui, Amazon S3 Select fonctionne sur des objets stockés aux formats CSV et JSON. Suite aux commentaires de nos clients, nous avons le plaisir d’annoncer la prise en charge de S3 Select pour le format Apache Parquet, JSON Arrays et la compression BZIP2 pour les objets CSV et JSON. Nous ajoutons également la prise en charge de CloudWatch Metrics for S3 Select, ce qui vous permet de surveiller l’utilisation de S3 Select pour vos applications.
Paquet est très répandu parce qu’il prend en charge divers moteurs de requêtes tels que Hive, Presto ou encore Impala, ainsi que plusieurs environnements, notamment Spark et MapReduce. S3 Select Parquet vous permet d’utiliser S3 Select afin d’extraire des colonnes précises de données stockées dans S3, et il prend en charge la compression par colonne grâce à GZIP ou Snappy. Vous pouvez spécifier les formats CSV ou JSON dans les résultats, mais aussi déterminer la façon dont les archives sont délimitées dans les résultats.
Grâce à la prise en charge de JSON Arrays, vous pouvez itérer sur des nœuds internes dans des objets JSON. Vous pouvez requérir ces objets JSON nichés en spécifiant le chemin de navigation dans le champ FROM des requêtes S3 Select.
BZIP2 est un format de compression très répandu utilisé pour compresser des données textuelles. Il est généralement plus efficace que beaucoup d’autres types d’algorithmes de compression.
CloudWatch Metrics for S3 vous permet de suivre l’état de vos applications. Ces métriques sont disponibles à intervalles d’une minute et vous permettent d’identifier rapidement des problèmes opérationnels et d’agir dessus. Les nouvelles métriques spécifiques de S3 Select incluent le compte de requêtes S3 Select, la quantité de données analysées et la quantité de données renvoyées.
Ces fonctionnalités pour Amazon S3 Select sont disponible dans toutes les régions commerciales AWS à compter d'aujourd'hui.
Pour en savoir plus sur Amazon S3 Select, consultez la page Sélection de contenu à partir d’objets du Guide du développeur Amazon S3. Pour en savoir plus sur Amazon CloudWatch Metrics for S3, consultez la page Surveillance des métriques avec Amazon CloudWatch du Guide du développeur Amazon S3. Pour démarrer, rendez-vous dans l'AWS Management Console.