一般性问题

问:什么是 Amazon SageMaker?

Amazon SageMaker 是一项完全托管的服务,可以帮助数据科学家和开发人员快速轻松地构建、训练和部署机器学习模型。

问:Amazon SageMaker 有什么作用?

Amazon SageMaker 可以帮助开发人员和数据科学家构建机器学习模型,以便在预测性智能应用程序中使用。

问:如何开始使用 Amazon SageMaker?

要开始使用 Amazon SageMaker,您需要登录 Amazon SageMaker 控制台,使用示例笔记本启动笔记本实例,修改该实例并将其连接到您的数据源,根据示例构建/训练/验证模型,然后通过简单的输入将生成的模型部署到生产环境中。

问:Amazon SageMaker 在哪些地区可用?

有关支持 Amazon SageMaker 的 AWS 地区列表,请访问所有 AWS 全球基础设施的 AWS 地区表。有关更多信息,另请参阅 AWS 一般参考中的地区和终端节点

问:我是否可以获取从我的账户发起的 Amazon SageMaker API 调用历史记录来进行安全分析和运行故障排除? 

是的。要获取从您的账户发起的 Amazon SageMaker API 调用的历史记录,您只需在 AWS 管理控制台中打开 AWS CloudTrail 即可。*不会*记录并提供 Amazon SageMaker Runtime 中的以下调用:InvokeEndpoint。

问:Amazon SageMaker 的服务可用性水平如何?

Amazon SageMaker 旨在提供高可用性。没有维护窗口期或计划停机时间。Amazon SageMaker API 在 Amazon 稳定可靠且具有高可用性的数据中心中运行,相关的服务堆栈会在每个 AWS 地区中的三处数据中心进行复制配置,以实现容错,防止服务器故障或可用区中断等事故导致的损失。

问:Amazon SageMaker 有哪些安全防护保障?

Amazon SageMaker 可以确保机器学习模型项目和其他系统项目在传输中和静态下全部经过加密。对 Amazon SageMaker API 和控制台发出的请求全部通过安全 (SSL) 连接进行。您可以为 Amazon SageMaker 分配 AWS Identity and Access Management 角色,以使它能够代表您提供培训和部署资源的访问权限。您可以将加密的 S3 存储桶用于模型项目和数据,并为 Amazon SageMaker 笔记本、训练任务和终端节点分配 KMS 密钥来加密附加的 ML 存储卷。

问:AWS SageMaker 如何保护我的代码安全?

Amazon SageMaker 将代码存储在 ML 存储卷上,通过安全组保证安全,并可以选择在静态时加密。

问:Amazon SageMaker 是如何收费的?

您需要为用于托管笔记本、训练模型、执行预测和记录输出日志的 ML 计算、存储和数据处理资源付费。借助 Amazon SageMaker,您可以选择用于托管笔记本、训练和模型托管的实例的数量和类型。您只需按您的实际用量付费;既没有最低费用,也无需预付费。

问:如果我有自己的笔记本、训练或托管环境,会怎么样?

Amazon SageMaker 提供完整的端到端工作流,但是您能够继续将现有工具与 Amazon SageMaker 结合使用。您可以根据业务需求将每个阶段的结果轻松传入和传出 Amazon SageMaker。

托管的 Jupyter 笔记本

问:支持哪些类型的笔记本?

目前支持 Jupyter 笔记本。

问:当我停止工作区后,你们如何保存笔记本文件?

您可以在附加的 ML 存储卷上保存您的笔记本文件。当笔记本实例关闭时,ML 存储卷将断开,而当笔记本实例重新启动时,存储卷将重新连接。内存中的存储项目将不会保存。

问:如何增加笔记本的可用资源?

在附加的 ML 存储卷上保存您的文件和数据后,您可以修改笔记本实例,并通过 Amazon SageMaker 控制台选择更大的配置文件。笔记本实例将与更多可用资源,以及相同的笔记本文件和已安装的库一起重新启动。

问:如何使用 Amazon SageMaker 笔记本训练模型?

启动示例笔记本后,您可以自定义笔记本以使之适合您的数据源和架构,并执行 AWS API 创建训练任务。训练任务的进度或完成度可通过 Amazon SageMaker 控制台或 AWS API 获取。

模型训练

问:对于可用于训练的数据集,有没有大小限制?

利用 Amazon SageMaker 训练模型可以使用的数据集没有固定的大小限制。

问:我可以将哪些数据源轻松提取到 Amazon SageMaker 中?

您可以在创建训练任务时指定训练数据的 Amazon S3 位置。

问:Amazon SageMaker 使用哪些算法来生成模型?

Amazon SageMaker 包括一些内置算法,例如线性回归算法、逻辑回归算法、k-means 集群算法、主成分分析算法、因式分解机算法、神经主题建模算法、潜在狄利克雷分配算法、梯度提高树算法、序列到序列算法、预测时间序列 word2vec 和镜像分类算法等。Amazon SageMaker 还提供经过优化的 Apache MXNet、Tensorflow、Chainer 和 PyTorch 容器。此外,Amazon SageMaker 还支持根据记录的规格通过 Docker 镜像提供的自定义训练算法。

问:什么是 Automatic Model Tuning?

大多数 Machine Learning 算法都提供了各种各样的参数,这些参数控制了底层算法的运算方式。这些参数通常被称为超参数,它们的值会影响经过训练的模型的质量。Automatic Model Tuning 是为能够生成最优模型的算法寻找超参数组合的过程。

问:Automatic Model Tuning 可用来优化哪些模型?

您可以在 Amazon SageMaker 中基于任何算法运行 Automatic Model Tuning,只要它们在科学上是可行的,包括内置的 SageMaker 算法、深度神经网络或者您以 Docker 镜像的形式引入 Amazon SageMaker 中的任意算法。

问:可以在 Amazon SageMaker 之外使用 Automatic Model Tuning 吗?

目前不可以。只有在 Amazon SageMaker 内部使用它,才能获得最佳的模型优化性能和体验。

问:什么是底层优化算法?

目前,我们用于优化超参数的算法是对贝叶斯算法的自定义实现。其目的是在优化过程中优化客户指定的目标参数。具体来说,它检查已完成训练任务的目标参数,然后利用这一信息推断下一个训练任务的超参数组合。

问:系统针对优化提供具体的超参数建议吗?

不。某些超参数对模型性能的影响取决于各种各样的因素,很难肯定地说一个超参数比其他超参数更重要,因此需要对它进行优化。对于 Amazon SageMaker 的内置算法,我们会提示每个超参数是否可进行优化。

问:每个超参数优化任务用时多久?

超参数优化任务的用时长短取决于多种因素,包括数据的大小、底层算法和超参数的值。此外,客户可以选择同时执行的训练任务的数量和训练任务的总数量。所有这些选择都会影响超参数优化任务的用时。 

问:能否像优化模型一样既快速又准确地同时优化多个目标?

目前不可以。目前,您必须指定一个目标参数来优化或更改您的算法代码,以生成一个新指标(该指标是两个或更多有用指标之间的加强平均值),并在优化过程中对该目标指标进行优化。

问:Automatic Model Tuning 是如何收费的?

超参数优化任务本身不收费。您需要按照模型训练定价为超参数优化任务启动的训练任务付费。

问:Automatic Model Tuning 是如何收费的?

超参数优化任务本身不收费。您需要按照模型训练定价为超参数优化任务启动的训练任务付费。

模型部署

问:我能否访问 AWS SageMaker 运行所在的基础设施?

否。AWS SageMaker 会代您运行计算基础设施,从而执行运行状况检查、应用安全补丁和执行其他例行维护。您也可以通过在自己托管的环境中训练自定义推理代码来部署模型项目。

问:如何在投产后扩展 Amazon SageMaker 模型的大小和性能?

Amazon SageMaker 托管使用 Application Auto Scaling 自动扩展到您的应用程序所需的性能。此外,您可以在不停机的情况下通过修改终端节点配置手动更改实例的数量和类型。

问:如何监控我的 Amazon SageMaker 生产环境?

Amazon SageMaker 将性能指标发到 Amazon CloudWatch Metrics,这样您可以跟踪指标、设置警报,并自动响应生产流量变化。此外,Amazon SageMaker 还会将日志写入 Amazon Cloudwatch Logs,让您能够监控生产环境并对其进行故障排除。

问:哪种模型能够通过 Amazon SageMaker 进行托管?

Amazon SageMaker 可托管符合推理 Docker 镜像的记录规格的任何模型,其中包括利用 Amazon SageMaker 模型项目和推理代码创建的模型。

问:Amazon SageMaker 支持的并发实时 API 请求的数量是多少?

Amazon SageMaker 旨在将每秒完成的事务量扩展到一个更大值。精确的数量因部署的模型以及部署模型的目标实例的数量和类型而有所不同。


问:什么是批量转换

通过批量转换,您可以针对大批量或小批量数据运行预测。无需将数据集拆分为多个区块,也无需管理实时终端节点。使用一个简单的 API,您可以轻松快速地请求对大量数据记录进行预测并转换数据。

 

了解有关 Amazon SageMaker 定价的更多信息

访问定价页面
准备好开始使用了吗?
注册
还有更多问题?
联系我们