发布于: Sep 13, 2022

Amazon SageMaker Studio 是一个适用于机器学习 (ML) 的完全集成的开发环境 (IDE),该环境供数据科学家和开发人员执行机器学习工作流程的每个步骤,从准备数据到构建、训练、优化和部署模型。SageMaker Studio 附带快速启动的协作笔记本。您可以在 Studio 中快速启动笔记本,而无需中断工作即可轻松增加或减少底层计算资源,甚至只需单击几下鼠标即可共享笔记本。今天,我们很高兴地宣布,Amazon SageMaker Studio 笔记本现在附带与 AWS Glue 交互式会话的内置集成。数据科学家和数据工程师可以使用由 AWS Glue 交互式会话管理的无服务器 Apache Spark 运行时环境,在其 Studio 笔记本中以交互方式大规模准备数据。

使用 SageMaker Studio Notebooks 中的 Glue 交互式会话很简单;您可以为 Studio 笔记本选择内置的 Glue PySpark 或 Glue Spark 内核,以在数秒内初始化交互式无服务器 Spark 会话,而无需担心预置和管理复杂的计算集群基础设施。初始化后,您可以直接在 Studio 笔记本中快速浏览 Glue 数据目录、运行大型查询以及使用 Spark 交互式分析和准备数据。然后,您可以使用 SageMaker Studio 中专门构建的 ML 工具,使用准备好的数据来构建、训练、优化和部署模型。 

SageMaker Studio 中的 Glue 交互式会话现已在以下 AWS 区域全面推出:美国东部(俄亥俄州)、美国东部(弗吉尼亚州北部)、美国西部(加利福尼亚州北部)、美国西部(俄勒冈州)、加拿大(中部)、欧洲地区(法兰克福)、欧洲地区(爱尔兰)、欧洲地区(斯德哥尔摩)、欧洲地区(米兰)、欧洲地区(巴黎)、欧洲地区(伦敦)、亚太地区(孟买)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(香港)、亚太地区(悉尼)、亚太地区(东京)、亚太地区(大阪)、中东(巴林)、非洲(开普敦)和南美洲(圣保罗)。要了解更多信息,请参阅此博客文章文档