Publié le: Jan 22, 2019
Vous pouvez désormais utiliser les scripts Python dans AWS Glue pour exécuter des tâches génériques de petite à moyenne envergure, qui font généralement partie intégrante des charges de travail ETL (extraction, transformation et chargement). Jusqu’ici, les tâches AWS Glue étaient limitées à celles exécutées dans un environnement sans serveur Apache Spark. Désormais, vous pouvez utiliser les tâches shell Python, par exemple, pour soumettre des requêtes SQL à des services comme Amazon Redshift, Amazon Athena ou Amazon EMR, ou exécuter des analyses scientifiques ou de Machine Learning.
Les tâches shell Python dans AWS Glue prennent en charge les scripts compatibles à Python 2.7, et sont fournies préchargées dans des bibliothèques telles que Boto3, NumPy, SciPy et Pandas. Vous pouvez exécuter vos tâches shell Python avec 1 DPU (unité de traitement des données) ou 0,0625 DPU (soit 1/16 DPU). Une seule DPU fournit des capacités de traitement des données représentant 4 vCPU de calcul et 16 Go de mémoire.
Pour en savoir plus sur la tarification des tâches shell Python dans AWS Glue, consultez la page de tarification. Pour en savoir plus sur la configuration des tâches shell Python dans AWS Glue, consultez notre documentation.
Pour connaître la disponibilité d’AWS Glue, consultez le tableau des régions AWS.