Veröffentlicht am: Apr 1, 2022
Kunden von AWS Glue DataBrew sind jetzt in der Lage, Daten zu bereinigen und umzuwandeln, die im ORC-Dateiformat (Optimized Row Columnar) gespeichert sind, einem weit verbreiteten Datenformat zum Speichern von Hive-Daten. Beim Erstellen eines Datensatzes in AWS Glue DataBrew können Sie jetzt zusätzlich zu den bereits unterstützten Dateiformaten Apache Parquet, Microsoft Excel, CSV und JSON auch ORC-Dateien verwenden.
Eine Liste der unterstützten Eingabeformate finden Sie unter Unterstützte Dateitypen für Datenquellen im Entwicklerleitfaden von AWS Glue DataBrew.
Aktualisiert am 11. April 2022 – In einer früheren Version dieses Beitrags wurde Apache Avro fälschlicherweise als unterstütztes Eingabeformat aufgeführt. Aktuell unterstützt AWS Glue DataBrew Apache Avro als Eingabeformat nicht.