投稿日: Nov 11, 2020
AWS Lake Formation が AWS GovCloud (米国西部) リージョンでご利用いただけるようになりました。
AWS Lake Formation はセキュアなデータレイクを、数日で簡単にセットアップできるサービスです。データレイクとはキュレートされた安全な一元化リポジトリで、すべてのデータが元の形式と分析用に処理された形式の両方で保存されます。データレイクを使用することにより、データのサイロ化が解消され、異なる種類の分析を組み合わせることが可能になります。このような分析から得られるインサイトは、ビジネス上の意思決定に大きく貢献します。
Lake Formation を利用すれば、データが配置される場所と適用するデータアクセスおよびセキュリティポリシーを定義するだけで、データレイクを作成できます。データレイクの作成後は、Lake Formation が、データベースおよびオブジェクトストレージからのデータの収集とカタログ化、新しく作成した Amazon S3 データレイクへのデータの移動、機械学習アルゴリズムを用いたデータのクリーンアップと分類、機密データに対するアクセスのセキュア化といった各種タスクを担います。これらのタスクが完了すると、ユーザーは一元化されたデータカタログにアクセスできるようになります。このデータカタログは、利用可能なデータセットおよびその適切な使用方法を説明しています。これらのデータセットを好みの分析や機械学習サービス (Amazon EMR for Apache Spark、Amazon Redshift Spectrum、Amazon Athena など) と併せて活用できます。