本指南介绍了用于将广告和营销数据连接到 AWS 服务的数据摄取模式。数据可以来自各种数据存储,激活后可用于设置 Customer 360 概况、AWS Clean Rooms 协作、人工智能和机器学习(AI/ML)训练,以及分析应用程序。本指南包括演示数据管道的概述架构图,以及六种架构模式,它们展示了为您的分析工作负载预置数据的不同方法。

请注意:[免责声明]

架构图

下载架构图 PDF 
  • 概览
  • 此架构图概述了如何将存储在各种数据来源中的数据源连接到 AWS。要查看架构模式,请打开其他选项卡。

  • 使用 AWS Lambda 实现 API 拉取模式
  • 此架构图展示了使用 AWS Lambda 针对 Amazon Ads API 和 Amazon Selling Partner API 实现 API 拉取模式。要查看其他架构模式,请打开其他选项卡。

  • 使用 Amazon AppFlow 实现 API 拉取模式
  • 此架构图展示了使用 Amazon AppFlow 针对 SaaS 应用程序数据实现 API 拉取模式。要查看其他架构模式,请打开其他选项卡。

  • 使用 Amazon S3 实现推送模式
  • 此架构图展示了使用 Amazon S3 针对 SaaS 应用程序数据实现 API 推送模式。要查看其他架构模式,请打开其他选项卡。

  • 批量拉取和更改数据捕获模式
  • 此架构图展示了使用 Amazon S3 针对 SaaS 应用程序数据实现 API 推送模式。要查看其他架构模式,请打开其他选项卡。

  • 托管文件传输模式
  • 此架构图展示了针对 RDBMS 源的批量拉取和更改数据捕获模式。要查看其他架构模式,请打开其他选项卡。

  • 文件复制模式
  • 此架构图展示了 SFTP 数据来源的托管文件传输模式。要查看其他架构模式,请打开其他选项卡。

Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。

上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。

  • 本指南中的服务是无服务器的,使用户无需管理(虚拟或裸机)服务器。例如,Step Functions 是一种用于构建工作流的无服务器托管服务,可减少与构建和管理工作流程解决方案相关的无差别繁重工作。AWS Glue 是一种用于数据处理任务的无服务器托管服务。

    同样,以下服务也免去了容量管理的需要:用于通知的 Amazon SNS、用于密钥管理的 AWS KMS、用于密钥的 Secrets Manager、用于事件驱动架构的 EventBridge、用于低延迟 NoSQL 数据库的 DynamoDB、用于与第三方应用程序集成的 AppFlow、用于文件传输协议的 Transfer Family、用于发现和同步远程数据来源(本地或其他云)的 DataSync,以及用于简化受支持数据库之间迁移的托管数据迁移服务 AWS DMS

    阅读《卓越运营》白皮书 
  • IAM 可管理对特定资源和操作的最低权限访问。AWS KMS 可使用 Pretty Good Privacy(PGP)加密数据文件,为静态数据和传输中数据提供加密。Secrets Manager 可为远程系统访问提供密钥,并为个人身份信息(PII)数据提供哈希密钥。CloudWatch 监控本指南中使用的所有服务的日志和指标。作为托管服务,这些服务不仅支持强大的安全态势,还能帮助您腾出时间,集中精力处理数据和应用程序逻辑,以加强安全性。

    阅读《安全性》白皮书 
  • 在管道中使用 Lambda 仅限于文件级处理(例如解密)。这样可以避免管道达到 15 分钟的运行时间限制。对于所有行级处理,AWS Glue Spark 引擎可进行扩展,以处理大量数据。此外,您还可以使用 Step Functions 为任何失败的 AWS Glue 作业设置重试、退避率、最大尝试次数、间隔和超时时间。

    阅读《可靠性》白皮书 
  • 本指南中的无服务器服务(包括 Step FunctionsAWS GlueLambdaEventBridgeAmazon S3)减少了您需要管理的底层基础设施的数量,使您能够专注于解决业务需求。您可以使用自动部署将架构组件快速部署到任何 AWS 区域,同时解决数据驻留和低延迟需求。

    阅读《性能效率》白皮书 
  • AWS Glue 执行数据转换时,您只需在处理过程中支付基础设施费用。对于数据目录,您需要为元数据的存储和访问支付基本月度费用。使用 EventBridge 免费套餐,您可以安排规则来启动数据处理工作流程。使用 Step Functions 工作流程,您可以根据状态转换的次数付费。此外,通过租户隔离模型和资源标记,您可以建立自动成本使用警报,帮助您衡量每个租户、应用模块和服务的具体成本。

    阅读《成本优化》白皮书 
  • 本指南中使用的无服务器服务(如 AWS GlueLambdaAmazon S3)可根据需求自动优化资源利用率。您可以使用 Amazon S3 生命周期配置来定义策略,根据访问模式将对象移动到不同的存储类,从而扩展此指南。

    阅读《可持续性》白皮书 

实施资源

提供了在 AWS 账户中进行实验和使用的详细指南。构建指南的每个阶段(包括部署、使用和清理)都将被检查,以便为部署做好准备。

示例代码为起点。它经过行业验证,是规范性但不是决定性的,可以帮助您开始。

[主题]
[内容类型]

[标题]

[子标题]
此[博客文章/电子书/指南/示例代码]演示了如何 [插入简短描述]。

免责声明

示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。

本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。

此页内容对您是否有帮助?