如下图所示,我们通过一系列操作,清晰地界定了从域所有者到单元管理员的角色和职责,涵盖了基础设施的部署和管理。

该工作流程包括以下步骤:
根域所有者(管理员)通过控制台创建一个 SageMaker Unified Studio 域。域创建成功后,你将获得该域对应的 SageMaker Unified Studio URL。Unified Studio 是一个基于浏览器的应用程序,可以通过你的 AWS Identity and Access Management (IAM) 身份与访问管理用户凭证、AWS IAM Identity Center 管理的来自身份提供者 (IdP) 的凭证,或 SAML 凭证进行身份验证。
在用户接入操作流程中,管理员需要设置单点登录 (SSO) 用户、SSO 用户组以及被授权可以登录 SageMaker Unified Studio 的 IAM 用户。也可以给 IAM 角色分配域访问权限,但这些 IAM 角色仅能用于通过编程方式访问域。使用快速域部署流程时,会创建默认的项目配置文件 (Project Profile) 模板。项目配置文件是一个包含 AWS 工具和服务配置的蓝图 (Blueprint) 集合。你可以创建以下项目配置文件:
生成式 AI 应用开发:提供基于 Amazon Bedrock 基础模型 (Foundation Model) 和相关工具构建生成式 AI 应用的多种工具。
SQL 分析:提供 SQL 编辑器,用于查询 Amazon SageMaker Lakehouse、Amazon Redshift 和 Amazon Athena 中的数据。
数据分析和 AI-ML 模型开发:提供构建和管理机器学习 (ML) 及生成式 AI 模型的工具。这些工具基于AWS Glue、Athena、Amazon Managed Workflows for Apache Airflow (Amazon MWAA)、Amazon SageMaker AI 和 SageMaker Lakehouse 构建。
自定义项目配置文件:构建自定义模板。可以根据你的业务需求,结合多个蓝图与不同的工具构建自定义模板。
管理员还可以将项目配置文件模板授权给特定用户和用户组,从而实现基于用户角色控制资源部署。默认情况下,所有用户均有权使用默认项目配置文件。然而,管理员可以修改此设置,限制某些项目配置文件的访问权限,仅授权特定用户和用户组使用。
通过快速部署设置,还可以创建与 AWS CodeCommit 的默认 Git 连接,以便你管理代码库。你也可以选择创建并启用新 Git 连接来连接 GitHub、GitHub Enterprise Server、GitLab 以及 GitLab Self-Managed 实例。SageMaker Unified Studio 域的所有用户默认可以使用 Amazon Q 的 Free Tier 版本。如果已在 IAM Identity Center 中配置了域用户,可以为域用户配置 Amazon Q Developer Pro。
在初始设置过程中,管理员还需要授予域用户 Amazon Bedrock 无服务器模型的访问权限。
在多账户场景中,中央管理员关联所有 AWS 账户,关联账户的管理员允许关联并启用所需蓝图,中央管理员从而可以使用启用的蓝图创建项目配置文件。请参阅本文末尾的附录,了解更多详情。
3. 为了整理组织内的数据资产,管理员访问 SageMaker Unified Studio URL 并登录,然后创建业务单元对应的域单元。
4. 将每个域单元的所有权委派给对应的业务单元,从而使业务单元能够在指定范围内自主管理资产。这种基于域的隔离提供了明确的界限,同时允许单元所有者独立管理其资产并执行相关策略。
步骤 3 和步骤 4 是快速部署设置中的可选步骤。如果当前不需要域单元,用户可以直接登录 SageMaker Unified Studio,然后根据业务使用场景构建数据产品。如果没有创建域单元,所有用户和用户组的访问权限都在根域级别,授权策略作用在根域上。