面向数据科学家的 Amazon SageMaker

适用于 ML 生命周期的全集成开发环境 (IDE)

前 2 个月在 Studio 笔记本上每月 250 小时 ml.t3.medium,

可通过 AWS 免费套餐获得

从结构化和非结构化数据源访问数据

使用专用工具提高生产力

只需单击几下即可完全托管的 Jupyter Notebook

工作原理

数据科学研究数据以提取对业务有意义的洞察。它提出并回答诸如发生了什么、为什么发生以及将发生什么等问题。机器学习 (ML) 对数据科学至关重要,因为机器学习使机器能够解决传统分析无法通过基于规则的逻辑轻松解决的问题。ML 通过从示例中学习来分析数据并发现模式。 然后机器可以使用这些模式来识别未知实例。Amazon SageMaker 提供了一系列广泛的 ML 功能,成千上万的客户使用这些功能来访问和分析数据,以及构建、训练和部署高质量的 ML 模型。使用 Amazon SageMaker 可以将您的数据科学团队的生产效率提高 10 倍之多。

面向数据科学家的 Amazon SageMaker

准备

在几分钟内准备机器学习数据

借助 SageMaker Data Wrangler 的数据选择工具,您可以从多个数据源中快速选择数据,例如 Amazon Athena、Amazon Redshift、AWS Lake Formation、Amazon Simple Storage Service (S3) 和 Amazon SageMaker Feature Store。您可以编写数据源查询,并将数据从各种文件格式直接导入到 SageMaker,然后使用 SageMaker Data Wrangler 的可视化模板和内置数据转换确保将准备的数据生成准确的机器学习模型。

了解更多 »
在几分钟内准备机器学习数据

低延迟特征存放区

SageMaker Feature Store 是一个完全托管的用于存储、更新、检索和共享 ML 特征的存储库,可批量提供完全相同的特征用于训练,并可以实时提供完全相同的特征用于推理,因此您无需编写代码即可保持特征的一致性。 您可以轻松地添加新特征、更新现有特征、批量检索特征用于训练,并可在毫秒级延迟低至个位数的情况下获得相同特征,用于实时推理。

了解更多 »
低延迟特征存放区

使用笔记本进行可扩展的数据准备

您只需点击几次,就可以从 SageMaker Studio 通过视觉方式浏览、发现和连接在 Amazon EMR 上运行的 Apache Spark 数据处理环境。连接之后,您可以交互地查询、浏览和显示数据,并使用您选择的语言(SQL、Python 和 Scala)运行 Spark 任务以构建端到端数据准备和 ML 工作流。

了解更多 »
使用笔记本进行可扩展的数据准备

数据标注

Amazon SageMaker 数据标注允许您识别原始数据,例如图像、文本文件和视频,并添加信息标签来为您的 ML 模型创建高质量的训练数据集。

了解更多 »
数据标注

构建

一键式 Jupyter Notebooks

Amazon SageMaker Studio Notebooks 是一键式 Jupyter Notebooks,可以快速启动。底层计算资源极具弹性,让您可以轻松启用或关闭可用资源,并且更改将在后台自动进行,不会干扰您的工作。只需单击一次即可共享笔记本,您的同事可以获得保存在同一位置的完全相同的笔记本。

了解更多 »
一键式 Jupyter Notebooks

内置算法

Amazon SageMaker 在预构建的容器映像中提供超过 15 种可用的算法,这些容器可被用来快速训练与运行推理。

开始使用 »
内置算法

预构建解决方案和开源模型

Amazon SageMaker JumpStart 使用预构建解决方案帮助您快速开始使用 ML,而且几次单击即可完成此类解决方案的部署。SageMaker JumpStart 还支持对超过 150 种热门的开源模型进行一键式部署和优化。

开始使用 »
预构建解决方案和开源模型

针对主流框架专门优化

Amazon SageMaker 针对许多热门的深度学习框架经过专门优化,例如 TensorFlow、Apache MXNet、PyTorch 等等。框架始终是最新版本,而且针对在 AWS 上的性能经过优化。您无需手动设置这些框架,就可以在内置容器中使用它们。

开始使用 »
针对主流框架专门优化

训练

检测偏差并了解预测

Amazon SageMaker Clarify 会提供数据,以便在数据准备期间和训练完成后通过进行偏差检测来提高模型质量。SageMaker Clarify 还提供模型可解释性报告,以便利益相关者可以看到模型做出预测的方式和原因。

了解更多 »
检测偏差并了解预测

组织、跟踪和评估训练运行

Amazon SageMaker Experiments 会自动捕获训练输入参数、配置和结果,并将它们存储为“实验”。您可以浏览进行中的实验,根据实验特征搜索先前的实验、查看先前的实验及其结果,以及直观比较实验结果。

了解更多 »
组织、跟踪和评估训练运行

检测和调试问题

Amazon SageMaker 调试程序可以实时捕获指标,因此您可以在将模型部署到生产之前快速纠正性能问题。

了解更多 »
检测和调试问题

部署

持续监控模型

Amazon SageMaker Studio 模型监控器会自动检测模型中的概念偏差,并提供详细的警报,帮助确定问题的根源,以便您不断提高模型质量。通过 SageMaker 训练的所有模型都会自动发送关键指标,这些指标可以在 SageMaker Studio 中收集和查看。

了解更多 »
持续监控模型

轻松部署选项

Amazon SageMaker 提供了最广泛的 ML 基础设施和模型部署选项,可以满足您的使用场景需求,无论是实时还是批量,因此您可以轻松地大规模部署您的 ML 模型。SageMaker 支持从低延迟(几毫秒)和高吞吐量(每秒数十万个推理请求)到针对自然语言处理 (NLP) 和计算机视觉 (CV) 等使用场景的长时间运行推理的完整推理要求范围。

了解更多 »
轻松部署选项

开始使用

详细了解 Amazon SageMaker Studio

查看网页 »

了解机器学习

开始构建 »

还有更多问题?

探索资源 »

更深入了解 AWS