投稿日: Apr 1, 2022

AWS Glue DataBrew をご使用のお客様は、今後、Optimized Row Columnar (ORC) ファイル形式で保存されたデータのクリーニングと変換が行えます。この形式は、Hive データの保存のために広く使用されている形式です。AWS Glue DataBrew 内のデータセットを作成する際、すでにサポート済みである Apache Parquet、Microsoft Excel、CSV、JSON の各ファイル形式に加えて、ORC ファイルも選択していただけます。 

サポートされる入力形式の一覧は、「AWS Glue DataBrew デベロッパーガイド」の「Supported file types for data sources」(データソースとしてサポートされるファイル形式) でご確認ください。

2022 年 4 月 11 日更新 - この投稿で、サポートされている入力形式として Apache Avro が間違ってリストされていました。この日付の時点で、AWS Glue DataBrew は Apache Avro を入力形式としてサポートしていません。