Publié le: Feb 24, 2022
Les clients AWS Glue DataBrew peuvent désormais choisir un ou plusieurs fichiers de sortie au lieu de fichiers générés automatiquement pour leurs tâches de recette sur DataBrew. Les clients peuvent générer un seul fichier de sortie lorsque la sortie est petite ou que les systèmes en aval doivent la consommer plus facilement, comme les outils de visualisation. Dans certains cas, les clients souhaitent personnaliser les partitions du fichier de sortie pour un stockage et un transfert efficaces.
Les clients peuvent simplement sélectionner l'option de fichier de sortie unique ou indiquer un nombre pour leurs fichiers de sortie lors de la configuration d'une tâche de recette dans DataBrew. Cela donne aux clients la flexibilité de gérer les sorties des tâches de recette pour la visualisation, l'analyse des données et les rapports, tout en aidant à empêcher les clients de générer trop de fichiers.
Cette fonction est disponible dans la plupart des Régions AWS publiques et AWS GovCloud (US, côte ouest). Pour savoir où AWS Glue DataBrew est disponible, consultez le tableau des régions AWS. AWS Glue DataBrew est un outil visuel de préparation des données qui permet de nettoyer et de normaliser facilement les données à l'aide de plus de 350 transformations prédéfinies, le tout sans avoir à écrire le moindre code. Vous pouvez automatiser le filtrage des anomalies, la conversion des données en formats standard, la correction des valeurs invalides et d'autres tâches.
Pour démarrer, consultez les ressources suivantes :