Publié le: Nov 28, 2022

AWS Glue for Ray est une nouvelle option de moteur sur AWS Glue. Les ingénieurs de données peuvent utiliser AWS Glue for Ray afin de traiter de larges jeux de données grâce à Python et aux bibliothèques Python populaires. AWS Glue est un service évolutif d'intégration des données sans serveur utilisé dans le cadre de la découverte, la préparation, le déplacement et l'intégration des données depuis des sources multiples. AWS Glue for Ray associe cette option sans serveur pour l'intégration de données avec Ray (ray.io), une infrastructure de calcul open source populaire qui vous aide à mettre les charges de travail Python à l'échelle.

Vous payez uniquement pour les ressources dont vous vous servez lorsque vous exécutez du code. Par ailleurs, vous n'avez pas besoin de configurer ni d'ajuster vos ressources. AWS Glue for Ray facilite le traitement distribué de votre code Python sur des clusters multi-nœuds. Vous avez la possibilité de créer et d'exécuter des tâches Ray partout où vous exécutez déjà des tâches AWS Glue ETL (extraction, transformation et chargement). Cela inclut les tâches AWS Glue existantes, l'interface de la ligne de commande (CLI) et les API. Vous pouvez sélectionner le moteur Ray par l'intermédiaire des blocs-notes d'AWS Glue Studio, Amazon SageMaker Studio ou localement. Lorsque la tâche Ray est prête, vous pouvez l'exécuter à la demande ou selon un programme.

AWS Glue for Ray est disponible dans les Régions AWS suivantes : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Oregon), Asie-Pacifique (Tokyo) et Europe (Irlande). 

Pour en savoir plus, consultez notre documentation.