Amazon Web Services ブログ

[AWS Black Belt Online Seminar] データウェアハウスのAWSへの移行 資料及びQA公開

こんにちは、ソリューションアーキテクトの有岡です。

先日(2018/3/19)開催致しました AWS Black Belt Online Seminar「データウェアハウスのAWSへの移行」の資料を公開いたしました。当日、参加者の皆様から頂いた QA の回答と併せてご紹介致します。

Q1. Redshiftへのデータロードや取り出しには問題がありませんか?

A1. Redshiftにデータをロードするには一旦Amazon S3に置いていただくと、COPYコマンドで高速に取り込む事が可能です。多くの大規模なDWHでこの方法が利用されています。同様に取り出しもS3経由で高速に実行可能です。またAWSではお客様にデータの統制権があり、データを置いたり消したりすることはお客様の権限のもとでいつでも実行可能です。

 

Q2. Data Lakeにデータ投入する際に、メタデータ、属性データを付加する機能はありますか?

A2. Amazon S3にはメタデータ等を付与する機能はありませんが、一旦S3に保存したデータをAWS Glueでクロールし、Glueの機能で列の情報、データ配置等のメタデータを取得・管理することが可能です。

 

Q3. Redshiftクラスターリサイズ後のdeep Copyは実施した方が良いですか?それとも不必要ですか?

A3. 一般的には必要ありません。

 

以上です。

今後の AWS Black Belt Online Seminar のスケジュールは こちら です。皆様のご参加をお待ちしております。