Publié le: Nov 18, 2021

Les clients d'AWS Glue DataBrew peuvent désormais créer des jeux de données en écrivant des instructions SQL (Structured Query Language) pour récupérer les données d'Amazon Redshift et Snowflake à l'aide de connexions JDBC (Java Database Connectivity). Vous pouvez utiliser une requête spécialement conçue pour sélectionner les données que vous souhaitez et limiter les données renvoyées par les grandes tables avant de nettoyer, normaliser et transformer ces données avec DataBrew. Pour obtenir une liste des formats d'entrée pris en charge, consultez la liste des formats d'entrée d'AWS Glue DataBrew.

AWS Glue DataBrew est un outil visuel de préparation des données qui permet de nettoyer et de normaliser facilement les données à l'aide de plus de 250 transformations prédéfinies, le tout sans avoir à écrire le moindre code. Vous pouvez automatiser le filtrage des anomalies, la conversion des données en formats standard, la correction des valeurs invalides et d'autres tâches.

Pour démarrer avec DataBrew, consultez la console de gestion AWS ou installez le plugin DataBrew dans votre environnement de bloc-notes. Pour en savoir plus, regardez cette vidéo de mise en route et consultez la documentation de DataBrew.