投稿日: Aug 5, 2021

Amazon Athena で分析ユースケースに最適な形式で結果を保存できるようになりました。Athena の新しい UNLOAD ステートメントを使用すると、結果を Parquet、Avro、ORC、JSON、または区切りテキストの形式で結果を保存できます。Athena の SQL ベースのインターフェイスとオープンフォーマットのサポートは、ダウンストリーム分析処理用にデータを準備するパイプラインの作成、抽出、変換、ロード (ETL) に適しています。

データマートへのインポート用にソースデータをフォーマットする場合、サードパーティの可視化ツールへの入力を正規化する場合、または機械学習パイプライン用にデータを処理する場合などにおいて、UNLOAD はジョブに最適な形式を選択する柔軟性を提供します。パイプラインを自動化して保護するために、UNLOAD と Athena の 準備済みステートメント機能を組み合わせ、S3 の暗号化設定に応じて反復的な実行をパラメータ化し、データを暗号化できます。UNLOAD を使用すると、エンジニア、アナリスト、データサイエンティストは、スケーラブルなサーバーレス分析パイプラインを Athena ワークロード内に直接作成できます。 

UNLOAD は、Athena コンソール、API、および Athena の ODBC または JDBC ドライブを使用する SQL で使用できます。詳細については、Athena SQL リファレンスドキュメントの「UNLOAD」を参照してください。