新米プログラマー、八起ななこ(やおき・ななこ)は、 会社の全データを可視化して欲しいと依頼を受ける。データフォーマットも全く異なるデータをどう扱ったらいいか悩んだななこは、AWS ソリューションアーキテクトの目黒はじめに相談する。そこではじめから勧められたのは、データレイクの構築だった。
データレイクとは、あらゆる種類のデータを保存できる一元化されたリポジトリ(保管場所)です。リレーショナルデータベースに蓄積されているような構造化データ、テキスト・画像・映像のような非構造化データを、そのままの形で保存できるため、事前にデータを構造化しておくことが不要で、ビッグデータ処理、リアルタイム分析、機械学習など、さまざまなのタイプの分析を実行するために活用できます。AWS は、データレイクを構築するための様々なサービスを提供しています。
AWS Lake Formation は、安全なデータレイクを数日で簡単にセットアップできるサービスです。実はデータレイクを構築するには、設定や管理に関わる複雑で時間のかかる手作業のタスクが数多く必要になりますが、AWS Lake Formation を利用すれば、データが配置される場所と適用するデータアクセスおよびセキュリティポリシーを定義するだけで、 AWS 上で簡単にデータレイクを作成することができます。
※現在プレビュー版でのご提供になります。
AWS のオンラインセミナーシリーズ「 AWS Black Belt Online Seminar 」の 「 データレイク入門: AWSで様々な規模のデータレイクを分析する効率的な方法」の資料です。