如何排查在 SageMaker Studio 中访问 Amazon SageMaker 项目时出现的问题?

上次更新日期:2023 年 1 月 26 日

我想排查在 SageMaker Studio 中访问 Amazon SageMaker 项目时出现的问题。

解决方法

您可以使用 SageMaker 项目管理和编排端到端机器学习解决方案。从 Studio 环境创建或访问项目时,可能会由于以下一点或多点原因而遇到问题:

  • 缺少权限
  • 仅限 VPC 模式下的网络问题
  • Studio 用户界面问题

缺少权限

SageMaker 项目依靠 AWS Service Catalog 来使用或创建项目模板并为您的账户预置 AWS 资源。只有您授予项目权限后,您的 Studio 域用户才能访问或查看这些模板。

如果您的用户没有项目权限,则会收到一条类似于以下内容的错误消息:

Amazon SageMaker project templates aren't enabled for your account.
Contact your administrator to enable SageMaker project templates.

要解决此问题,请务必为管理员和域执行角色用户授予项目权限

此外,因为以下某项缺失、删除、修改或手动重新创建,您可能会遇到权限问题:

  • 激活 SageMaker 项目时创建的服务角色
  • Amazon SageMaker JumpStart

要解决此问题,请完成以下步骤以关闭 SageMaker 项目模板和 JumpStart:

1.    打开 SageMaker console(SageMaker 控制台)。

2.    在导航窗格中,选择 Domains(域)。

3.    使用域名旁边的按钮选择您的域。然后,在 Domains(域)面板的顶部,选择 Edit(编辑)。

4.    在 General settings(常规设置)页面上,选择 Next(下一步)。

5.    在 SageMaker Projects and JumpStart(SageMaker 项目 和 JumpStart)下,关闭 Enable Amazon SageMaker project templates and Amazon SageMaker JumpStart for this account(为此账户启用 Amazon SageMaker 项目模板和 Amazon SageMaker JumpStart)。同时,关闭 Enable Amazon SageMaker project templates and Amazon SageMaker JumpStart for Studio users(为 Studio 用户启用 Amazon SageMaker 项目模板和 Amazon SageMaker JumpStart)开关。

6.    选择下一步

7.    在 RStudio settings(RStudio 设置)页面上,选择 Next(下一步)。

8.    在 Amazon SageMaker Canvas settings(Amazon SageMaker Canvas 设置)页面上,选择 Submit(提交)。

9.    删除所有以 AmazonSageMakerServiceCatalogProduct* 开头的角色

10.  使用上述说明,开启激活 SageMaker 项目模板和 JumpStart 的切换开关。此步骤将为您创建多个新角色。要查看您的角色列表,请执行以下操作:在 Projects(项目)下,选择 Apps(应用程序)选项卡,然后选择 Control Panel(控制面板)。

注意:要获得访问 AWS Service Catalog 控制台所需的权限,请将托管策略 SageMakerFullAccess 附加到您的 Studio 用户的执行角色。

仅限 VPC 模式下的网络问题

对于仅限 VPC 网络访问类型,互联网访问处于非活动状态。因此,除非满足以下条件,否则您无法运行 Studio 笔记本:

  • 您的 VPC 有连接到 SageMaker API 和运行时的接口端点,或者有具备互联网访问权限的 NAT 网关。
  • 您的安全组允许出站连接。

如果您的 SageMaker 项目不需要 NAT 网关访问权限,则必须创建接口 VPC 端点(AWS PrivateLink)才能连接到 com.amazonaws.[region].servicecatalog。例如,如果您在 eu-west-1 AWS 区域使用 Studio,则使用 com.amazonaws.eu-west-1.servicecatalog。有关更多信息,请参阅使用仅限 VPC 模式的要求

要验证您的 Studio 的网络设置是否允许连接到 SageMaker API 和 Service Catalog 端点,请从 Studio 系统终端运行以下命令:

检查对 SageMaker API 端点的访问权限:

curl -v https://api.sagemaker.example-region.amazonaws.com

检查对所需区域中 Service Catalog 端点的访问权限:

curl -v https://api.sagemaker.example-region.amazonaws.com

如果您在运行这些命令时出现 Connection timed out(连接超时)错误,请验证您的 VPC 网络设置是否配置为仅限 VPC 模式

运行以下命令,从系统终端查看可用项目列表:

$ aws sagemaker list-projects --sort-by CreationTime --sort-order Descending

如果您无法在 SageMaker Studio 界面中查看相同的列表,请务必更新 Studio 的域。然后执行以下操作:

1.    启动 SageMaker Studio。

2.    在左侧边栏中,选择 Commands(命令)。

3.    在搜索栏中搜索 Reset Application State(重置应用程序状态),然后选择此选项。

注意:在 JupyterLab 3 中,默认情况下,左侧边栏上没有命令面板。要添加命令面板:在菜单上,选择 View(查看),然后在菜单栏上选择 Activate Command Palette(激活命令面板)。或者,可以使用键盘快捷键命令 Ctrl + Shift + C


这篇文章对您有帮助吗?


您是否需要账单或技术支持?