AWS Glue Data Catalog prend désormais en charge l'optimisation automatique des tables d'Apache Iceberg via Amazon VPC

Publié le: 21 nov. 2024

AWS Glue Data Catalog prend désormais en charge l'optimisation automatique des tables Apache Iceberg qui ne sont accessibles que depuis un environnement Amazon Virtual Private Cloud (VPC) spécifique. Vous pouvez activer l'optimisation automatique en fournissant une configuration VPC pour optimiser le stockage et améliorer les performances des requêtes tout en préservant la sécurité de vos tables.

AWS Glue Data Catalog prend en charge le compactage, la conservation des instantanés et la gestion des fichiers non référencés, ce qui vous permet de réduire la charge des métadonnées, de contrôler les coûts de stockage et d'améliorer les performances des requêtes. Les clients dont les configurations de gouvernance et de sécurité nécessitent qu'un compartiment Amazon S3 réside dans un VPC spécifique peuvent désormais l'utiliser avec Glue Catalog. Cela vous donne des fonctionnalités étendues pour la gestion automatique de vos données Apache Iceberg, quel que soit leur emplacement de stockage sur Amazon S3.

L'optimisation automatique pour les tables Iceberg via Amazon VPC est disponible dans 13 régions AWS, à savoir USA Est (Virginie du Nord, Ohio), USA Ouest (Oregon), Europe (Irlande, Londres, Francfort, Stockholm), Asie-Pacifique (Tokyo, Séoul, Mumbai, Singapour, Sydney) et Amérique du Sud (São Paulo). Les clients peuvent l'activer via la console AWS, l'interface de ligne de commande AWS ou les kits SDK AWS.

Pour commencer, vous pouvez désormais fournir la connexion réseau Glue en tant que configuration supplémentaire, ainsi que des paramètres d'optimisation tels que la période de rétention par défaut et les jours de conservation des fichiers non référencés. Le catalogue de données AWS Glue utilisera les informations VPC de la connexion Glue pour accéder aux compartiments Amazon S3 et optimiser les tables Apache Iceberg.
Pour en savoir plus, consultez le blog ainsi que la documentation relative à AWS Glue Data Catalog.