发布于: Dec 27, 2023

我们很高兴地宣布推出一种简单而安全的新方式来远程连接到 Amazon SageMaker 中的模型训练环境,以提高可观测性并加快调试速度。

从今天开始,您可以从本地开发环境对 SageMaker 中运行的模型训练代码进行远程调试。您现在可以轻松诊断卡住的训练作业、使用命令行工具监控底层计算资源、调试训练脚本,然后快速修复和执行该脚本。这项新功能使用 AWS Systems Manager (SSM) 为您提供对底层训练容器的 Shell 级别访问权限。如果您使用自己的 Amazon Virtual Private Cloud (VPC) 来完成模型训练作业,则还可以使用 AWS PrivateLink 为 SSM 设置 VPC 端点并以私有方式连接到容器。

此功能现已在提供 Amazon SageMaker Model Training 的所有区域推出。访问文档可以了解更多信息。