AWS でのデータレイク

Amazon S3 データレイクでデータサイロを排し、大規模な分析を可能にする

概要

AWS 上でのデータレイクは、データサイロを排して、エンドツーエンドのデータインサイトを最大化するのに役立ちます。 データレイクの基盤として Amazon Simple Storage Service (Amazon S3) を使用すると、データインジェスト、移動、保存から、ビッグデータ分析、ストリーミング分析、ビジネスインテリジェンス、機械学習 (ML) などのデータニーズをサポートするために AWS 分析サービスを、すべて極めて高い料金パフォーマンスで利用できます。AWS では 100 万を超えるデータレイクが稼働しています。

Amazon S3 は、比類のない耐久性、可用性、スケーラビリティ、セキュリティ、コンプライアンス、監査機能を備えているため、データレイクを構築するのに最適な場所です。AWS Lake Formation を使用すると、数か月ではなく数日で安全なデータレイクを構築することができます。AWS Glue を使用すると、データレイクと専用データおよび分析サービスとの間でシームレスなデータ移動が可能になります。

クラウドオブジェクトストレージは、すべてのデータレイクワークロードを駆動

企業の意思決定におけるデータレイクの進化と重要性の高まりについて学ぶ

AWS によるデータレイクの利点

Amazon S3 と Amazon DataZone を利用したデータレイク上のデータガバナンス

効果的なデータガバナンスは、データの完全性と信頼性を実現するための鍵です。データレイクが組織にとって重要な理由、データガバナンスの AWS モデル、データレイクの管理に役立つさまざまなサービスをご覧ください。  

AWS 上でのデータレイクに不可欠な柱

データレイクのデータを管理

AWS を使用して、きめ細かなデータアクセス権限を一元管理およびスケーリングできます。