投稿日: May 7, 2020
AWS 南米 (サンパウロ) リージョンで AWS Lake Formation が利用可能になりました。
AWS Lake Formation は、安全なデータレイクを数日で簡単にセットアップできるサービスです。データレイクとはキュレートされた安全な一元化リポジトリで、すべてのデータが元の形式と分析用に処理された形式の両方で保存されます。データレイクを使用することにより、データのサイロ化が解消され、異なる種類の分析を組み合わせることが可能になります。このような分析から得られるインサイトは、ビジネス上の意思決定に大きく貢献します。
Lake Formation を利用すれば、データが配置される場所と適用するデータアクセスおよびセキュリティポリシーを定義するだけで、データレイクを作成できます。データレイクの作成後は、Lake Formation が、データベースおよびオブジェクトストレージからのデータの収集とカタログ化、新しく作成した Amazon S3 データレイクへのデータの移動、機械学習アルゴリズムを用いたデータのクリーンアップと分類、機密データに対するアクセスのセキュア化といった各種タスクを担います。これらのタスクが完了すると、ユーザーは一元化されたデータカタログにアクセスできるようになります。このデータカタログは、利用可能なデータセットおよびその適切な使用方法を説明しています。ユーザーはこれらのデータセットを好みの分析や機械学習サービス (Apache Spark 向け Amazon EMR、Amazon Redshift、Amazon Redshift Spectrum、Amazon Athena など) と併せて活用できます。
AWS Lake Formation を利用できるリージョンの一覧については、AWS リージョン表をご参照ください。