投稿日: Feb 24, 2022

AWS Glue DataBrew をご利用のお客様は、DataBrew のレシピジョブ用に、自動生成ファイルではなく、単一または複数の出力ファイルを選択できるようになりました。お客様は、出力が小さい場合、またはダウンストリームシステムが出力をより簡単に使用する必要がある場合 (視覚化ツールなど) に、単一の出力ファイルを生成できます。場合によっては、効率的なストレージと転送のために出力ファイルのパーティションをカスタマイズしたいことがあります。  

お客様が必要なのは、DataBrew でレシピジョブを設定するときに、単一出力ファイルオプションを選択するか、出力ファイルの数を指定することだけです。これにより、お客様は、視覚化、データ分析、およびレポートのためにレシピジョブの出力を柔軟に管理できると同時に、お客様が多過ぎるファイルを生成するのを防ぐことができます。

この機能は、ほとんどのパブリック AWS リージョンと AWS GovCloud (米国西部) でご利用いただけます。AWS リージョン表を参照して、AWS Glue DataBrew が利用できるリージョンをご確認ください。AWS Glue DataBrew は、350 を超える事前構築済みの変換を使用して、コードを記述することなくデータを簡単にクリーニングおよび正規化できるビジュアルデータ準備ツールです。異常のフィルタリング、標準形式へのデータの変換、無効な値の修正などのタスクを自動化することが可能です。

使用を開始するには、次のリソースを参照してください。