Publié le: Apr 1, 2022
Les clients AWS Glue DataBrew peuvent désormais nettoyer et transformer les données stockées dans le format de fichier Optimized Row Columnar (ORC), un format de données largement utilisé pour le stockage des données Hive. Lorsque vous créez un jeu de données dans AWS Glue DataBrew, vous pouvez désormais utiliser des fichiers ORC en plus des formats de fichiers Apache Parquet, Microsoft Excel, CSV et JSON déjà pris en charge.
Pour obtenir une liste des formats d'entrée pris en charge, consultez la section Types de fichiers pris en charge pour les sources de données dans le guide du développeur AWS Glue DataBrew.
Mis à jour le 11 avril 2022 : cet article indiquait de manière inexacte qu'Apache Avro était un format d'entrée pris en charge. À ce jour, AWS Glue DataBrew ne prend pas en charge Apache Avro comme format d'entrée.