发布于: Jun 22, 2022
利用 AWS Lake Formation 这项服务,您几天内即可轻松创建一个安全的数据湖。数据湖是一个集中组织且安全的存储库,可以通过两种形式存储数据:原始形式和准备好用于分析的形式。利用数据湖,您可以分解数据孤岛并组合不同类型的分析,从而获得见解并指导作出更好的业务决策。
使用 Lake Formation 创建数据湖,您就可以定义数据的存储位置以及要应用的数据访问和安全策略。然后,Lake Formation 会从数据库和对象存储中收集数据并为其编目,将数据移动到新的 Amazon S3 数据湖,使用机器学习算法清理和分类数据,并保护对敏感数据的访问权限。接下来,您的用户可以访问那些描述了可用数据集及其适当用法的集中数据目录。然后,用户可以通过所选的分析和机器学习服务,利用这些数据集,例如 Amazon EMR for Apache Spark、Amazon Redshift Spectrum、AWS Glue、Amazon QuickSight 和 Amazon Athena。