了解如何构建可供组织中各种团队以自助方式发布和使用数据的数据湖。由于组织的目标是提升以数据为导向的程度,所以数据工程团队必须构建能够满足从开发人员到业务分析师再到数据科学家的各种用户的需求的架构。每个用户组都使用不同的工具,拥有不同的数据需求,并以不同的方式访问数据。
在本演讲中,我们将详细介绍如何使用 Amazon S3、Amazon Kinesis、Amazon Athena、Amazon EMR 和 AWS Glue 构建数据湖。本次研讨会由 Atlassian 的设计和集成负责人 Mohit Rao 讲授,Atlassian 是 JIRA Confluence 和 Stride 等产品的制造商。首先,我们将了解一下用于构建数据湖的几个常见架构。接下来,我们将展示 Atlassian 如何构建这样一个自助数据湖:公司的任何团队都可以在该数据湖中发布数据集,以供各种用户使用。
观看研讨会录像 | 下载演示文稿