Publié le: Jan 28, 2021
AWS Glue DataBrew prend maintenant en charge les options de délimitation suivantes pour ses jeux de données, ce qui vous donne la possibilité d'introduire une variété de fichiers .csv et .tsv dans DataBrew pour la préparation des données. Les délimiteurs pris en charge sont les suivants :
- virgule (,)
- deux points (:)
- point-virgule (;)
- barre verticale (|)
- tabulation (\t)
- caret (^)
- espace ( )
AWS Glue DataBrew propose aux clients plus de 250 transformations prédéfinies pour automatiser les tâches de préparation des données (par exemple le filtrage des anomalies, la standardisation des formats et la correction des valeurs non valides) qui, autrement, nécessiteraient des jours ou des semaines d'écriture de transformations codées à la main. Une fois les données préparées, les clients peuvent immédiatement commencer à les utiliser avec le service AWS et les services d'analyse et de machine learning tiers pour interroger les données et entraîner les modèles de machine learning.
Pour en savoir plus, regardez cette vidéo de mise en route ou utilisez un exemple de jeu de données pour explorer DataBrew.
Pour commencer, visitez AWS Management Console ou installez le module d'extension DataBrew dans votre environnement de bloc-notes et reportez-vous à la documentation de DataBrew.