跳至主要内容

AWS 解决方案库

基于 AWS 的协作、统一数据和人工智能开发指南

为数据工程师、分析师、科学家和应用程序开发人员简化数据和人工智能应用程序的开发过程

概览

本指南演示如何使用 Amazon SageMaker Unified Studio 创建统一的开发体验,用于构建、部署、执行和监控跨 AWS 数据、分析和 AI/ML 服务的端到端工作流。通过展示 SageMaker Unified Studio 的功能,该指南可帮助您简化从摄取到产品部署的数据操作。该指南还说明这种集成方法如何提高效率、降低复杂性并提供对各种 AWS 服务的全面控制,最终简化复杂数据工作流程的管理。

工作原理

概览

此架构图显示了 Amazon SageMaker 如何为机器学习和数据工程师、数据管理员和生成式 AI 开发人员提供统一的协作体验,以加速从探索到生产的数据应用程序。

Diagram illustrating the AWS collaborative unified data and AI architecture, showing an authentication provider, Amazon SageMaker projects, portal interface, backend resources, and roles including data steward, data engineer, ML engineer, and data analyst. Backend resources highlight development, data infrastructure, and lakehouse capabilities.

生成式人工智能湖仓

该架构图显示 Amazon SageMaker Unified Studio 如何在统一门户中使用 Lakehouse 架构、基于 Web 的生成式人工智能工作室和编排工具,为销售预测提供协作式数据工程和分析体验。

Architecture diagram showing a collaborative unified Data & AI lakehouse solution on AWS. It illustrates data engineers and analysts accessing AWS services including IAM Identity Center, Amazon SageMaker Unified Studio, Amazon SageMaker Lakehouse, Amazon Q Developer, Amazon Redshift Serverless, Amazon S3, AWS Glue Data Catalog, Analytics Services such as AWS Glue ETL, Amazon Athena, Amazon EMR, Amazon Redshift, and Amazon MWAA, for sales forecasting project and data processing workflows.

协作模型部署

该架构图显示了亚马逊SageMaker如何使机器学习工程师能够在统一的门户中使用亚马逊SageMaker、SageMaker JumpStart和SageMaker Workflows协作开发、评估和部署销售预测模型。

Architecture diagram illustrating the AWS Collaborative Unified Data and AI development workflow. The diagram shows ML engineers accessing AWS IAM Identity Center, working through Amazon SageMaker Unified Studio, integrating database assets and coding capabilities via Amazon Q Developer, leveraging Amazon SageMaker Lakehouse (with Redshift Serverless, S3 storage, and AWS Glue Data Catalog), and utilizing ML capabilities in Amazon SageMaker for a sales forecasting project.

自信地进行部署

准备好部署了吗? 查看 GitHub 上的示例代码,了解详细的部署说明,以按原样部署或进行自定义以满足您的需求。

访问示例代码

Well-Architected 支柱

上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。

SageMaker Unified Studio 集成团队协作、Git、分析服务和 AI/ML 服务,以提供统一的数据开发体验。这会创建集中式操作控制面板,用于协作和执行数据产品的端到端数据摄取、准备和部署。通过支持协作并提供统一的开发人员体验,SageMaker Unified Studio 可帮助您进行运营设计,实现数据服务集成和部署的完全自动化。

阅读卓越运营白皮书

SageMaker Unified Studio 通过部署的 Web 域提供单点登录体验,这些域可以联合到 IAM Identity Center 等 IdP。您可以针对用户和群组实施访问控制策略,以便使用最低权限访问项目、数据和模型。通过将 SageMaker Unified Studio 域与联合 IdP 结合使用,您可以创建控制的逻辑分离,为您的组织定义权限护栏。这样,通过对访问控制的持续监控和微调,实现基于生命周期的访问管理。

阅读安全白皮书

SageMaker Unified Studio 统一数据摄取、存储和分析服务,包括 Amazon S3Amazon Redshift,为您的数据操作建立可靠的控制面板。您可以利用这些底层服务和工具,通过统一的 Web 体验在服务级别创建容错能力。SageMaker Unified Studio 界面可简化数据和分析服务的编排,从而更轻松地监控和控制数据工作负载。这可降低协调和管理单个服务的复杂性,以便更容易在单个 Web 界面中检测故障和实现恢复。

阅读可靠性白皮书

Amazon Q 开发者版使用生成式人工智能提供代码建议,从而降低开发的复杂性和工作量。SageMaker 提供对预训练模型的访问权限,并简化针对特定用例进行训练、验证和部署模型的过程。通过使用这些工具,您可以加快开发速度,并实施代码建议和模型部署,而无需管理复杂的底层 AI/ML 技术。

阅读性能效率白皮书

SageMaker Unified Studio 通过统一端到端开发流程,帮助您为数据工作负载选择合适的资源。它可以快速部署以及停用数据和分析服务,从而帮助控制与数据产品开发相关的成本。通过降低开发和部署的复杂性,SageMaker Unified Studio 可以帮助您更有效地管理服务。这可以降低数据传输成本、改进工作负载性能分析,以及改善动态资源分配。

阅读成本优化白皮书

除数据访问和生命周期控制以外,SageMaker Unified Studio 底层的托管服务还提供按需扩展。这种更便捷的数据访问和控制有助于持续监控使用情况,有助于减少数据操作的影响,并创建更高效的工作负载。因此,您可以更好地预测和控制使用情况,在不为未来需求预留资源的情况下扩大需求。

阅读可持续发展白皮书

免责声明

示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。

找到今天要查找的内容了吗?

请提供您的意见,以便帮助我们提高页面内容的质量