- AWS 解决方案库›
- AWS 上的无服务器、无代码数据湖快速启动指南
AWS 上的无服务器、无代码数据湖快速启动指南
概览
工作原理
此架构图显示了如何与 Salesforce (SFDC) 环境建立连接,以及如何从默认 SFDC 对象中提取、转换和加载数据到 AWS 以进行统一查询。
Well-Architected 支柱
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
本指南使用各种 AWS 服务来处理千篇一律的繁重工作,从而将第三方数据来源集成到您的 AWS 账户。Amazon AppFlow 可帮助您在您的 Salesforce 服务和 AWS 之间安全地传输数据,而 AWS Glue 可帮助您完全以自动化的方式从外部来源准备数据,从而更轻松地使用 Athena 进行查询。
本指南使用完全托管的服务来帮助保护关联的第三方数据来源,这样您就不必管理建立安全 API 集成所用的底层数据连接器。默认情况下,Amazon S3 使用托管加密密钥对您的静态数据进行加密,而 Amazon AppFlow 会管理关联的数据来源的安全证书。
本指南可帮助您可靠地扩展数据工作负载,而无需管理基础设施。例如,Amazon S3 具有高度可扩展性并提供持久的数据存储。Amazon AppFlow 可帮助您验证数据、安全地连接到数据来源,并监控数据流以快速解决问题。而且,数据目录仅提供集成数据所需的资源。
本指南演示了如何使用 Amazon AppFlow 实现系统间双向数据流自动化,只需点击几下即可轻松建立和扩展数据集成。数据工作流程可轻松扩展,且仅在需要时运行。
本指南使用 Amazon AppFlow,该工具会依据您根据业务目标设置的时间表自动预置和运行数据工作流程,从而帮助您降低成本。本指南还使用完全托管且无服务器的 AWS Glue,因此您只需为消耗的资源付费。此外,Amazon S3 还允许您将数据存档到存储层以降低成本。Amazon S3Intelligent-Tiering 存储类可在不牺牲性能的情况下根据访问模式自动节省成本。
本指南使用亚马逊 AppFlow 和 AWS G lue,它们使用无服务器架构来共享底层基础设施并减少不必要的操作。您可以安排它们自动运行,并且通过将 Amazon AppFlow 数据工作流程计划与自动 AWS Glue 爬网程序结合使用,您仅在需要时消耗资源,使它们不会在空闲时间运行。这有助于减少预置基础设施对环境的影响。
相关内容
Reinventing Small and Medium Businesses with Better Data Insights
这篇博文探讨了任何规模的智能企业如何通过多种方式重塑自我。
免责声明
找到今天要查找的内容了吗?
请提供您的意见,以便帮助我们提高页面内容的质量