張貼日期: Nov 28, 2018
AWS Lake Formation 是能在幾天內輕鬆設定安全資料湖的服務。資料湖是集中、專用且安全的儲存庫,可用原始格式和可進行分析的格式儲存您的所有資料。資料湖可讓您解決資料孤島的問題,並能合併不同類型的分析來產生洞見,協助您制定更有效的業務決策。
不過,在現今的環境中,資料湖的設定和管理涉及大量手動、複雜且耗時的任務。這項工作包括從不同來源載入資料、監控這些資料流程、設定分割區、啟用加密與管理金鑰、定義轉換任務和監控操作情形、將資料重新組織為單欄格式、設定存取控制設定、刪除重複資料、比對連結的記錄、授予資料集存取權及長期稽核存取權。
使用 Lake Formation 建立資料湖十分簡單,您只需定義資料所在位置和想套用的資料存取權與安全政策。Lake Formation 就會從資料庫和物件儲存系統收集資料並編列目錄、將資料移動到新的 Amazon S3 資料湖、運用 Machine Learning 演算法清理和分類資料,同時保護敏感資料的存取。您的使用者可以存取集中式資料目錄,其中描述了可用資料集和適當用途。您的使用者可透過他們選擇的分析與 Machine Learning 服務來運用這些資料集,例如 Amazon EMR for Apache Spark、Amazon Redshift、Amazon Athena、Amazon Sagemaker 及 Amazon QuickSight。
如需進一步了解並註冊預覽版,請瀏覽 AWS Lake Formation 網頁。
若要參加 2018 年 12 月 10 日舉辦的 AWS Lake Formation 網路研討會,按一下這裡即可註冊。