張貼日期: Aug 9, 2019

AWS Lake Formation 是能在幾天內輕鬆設定安全資料湖的服務。資料湖是集中、專用且安全的儲存庫,可用原始格式和可進行分析的格式儲存您的所有資料。資料湖可讓您解決資料孤島的問題,並能合併不同類型的分析來產生洞見,協助您制定更有效的業務決策。

不過,在現今的環境中,資料湖的設定和管理涉及大量手動、複雜且耗時的任務。這項工作包括從不同來源載入資料、監控這些資料流程、設定分割區、啟用加密與管理金鑰、定義轉換任務和監控操作情形、將資料重新組織為單欄格式、設定存取控制設定、使用機器學習識別可能的重複項目和比對資料集之間的記錄、授予資料集存取權及長期稽核存取權。 

使用 AWS Lake Formation 建立資料湖十分簡單,您只需定義資料所在位置和想套用的資料存取權與安全政策。AWS Lake Formation 就會從資料庫和物件儲存系統收集資料並編列目錄、將資料移動到新的 Amazon S3 資料湖、運用機器學習演算法清理和分類資料,同時保護敏感資料的存取。您的使用者可以存取集中式資料目錄,其中描述了可用資料集和適當用途。您的使用者可透過他們選擇的分析與機器學習服務來運用這些資料集,例如 Amazon EMR for Apache Spark、Amazon Redshift Spectrum 及 Amazon Athena。 

AWS Lake Formation 在美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (奧勒岡)、歐洲 (愛爾蘭) 及亞太區域 (東京) 等 AWS 區域皆可使用。如需提供 AWS Lake Formation 的所有區域,請瀏覽 AWS 區域頁面。瀏覽 AWS Lake Formation 主控台以開始使用 AWS Lake Formation。