发布于: Nov 28, 2018

AWS Lake Formation 是一项可以在几天内轻松建立安全数据湖的服务。数据湖是一个安全的集中式辅助存储库,它以数据原始形式和可用于分析的形式存储所有数据。利用数据湖,您可以分解数据孤岛并组合不同类型的分析,从而获得见解并指导作出更好的业务决策。

但是,现在设置和管理数据湖涉及大量耗时的复杂手动任务。这项工作包括加载来自不同来源的数据、监控这些数据流、设置分区、打开加密和管理密钥、定义转换作业并监控其操作、将数据重新组织成列格式、配置访问控制设置、删除冗余数据重复数据、匹配链接记录、授予对数据集的访问权限以及随时间推移审核访问权限。

使用 Lake Formation 创建数据湖就像定义数据存储位置以及要应用的数据访问和安全策略一样简单。然后,Lake Formation 从数据库和对象存储中收集和编目数据,将数据移动到新的 Amazon S3 数据湖,使用机器学习算法清理和分类数据,并保护对敏感数据的访问权限。接下来,您的用户可以访问描述可用数据集及其适当用法的集中式数据目录。然后,您的用户可以通过各自选择的分析和机器学习服务利用这些数据集,例如 Amazon EMR for Apache Spark、Amazon Redshift、Amazon Athena、Amazon Sagemaker 和 Amazon QuickSight。

要了解更多信息并注册预览版,请访问 AWS Lake Formation 网页

要加入 2018 年 12 月 10 日举行的 AWS Lake Formation 网络研讨会,请单击此处进行注册。