发布于: Oct 19, 2023
今天,我们将在 AWS Secret Region 推出 Amazon SageMaker。Amazon SageMaker 是一项完全托管的端到端机器学习服务,使数据科学家、开发者和机器学习专家能够快速地大规模构建、训练和托管机器学习模型。该服务将大幅度加速您所有的机器学习进程,并使您更快速地将机器学习添加到产品应用程序中。
我们将为 Amazon SageMaker 推出 5 个主要组件:
- 创作:零设置托管的 Jupyter Notebook IDE,用于数据探索、清理和预处理。您可以在常规实例类型或 GPU 支持的实例上运行这些实例。
- 模型训练:分布式模型构建、训练和验证服务。您可以使用内置的常用监督和无监督学习算法和框架,也可以使用 Docker 容器创建自己的训练。训练可以扩展到数十个实例以支持更快的模型构建。从 S3 读取训练数据,并将模型构件放入 S3。模型构件是依赖于数据的模型参数,而不是允许您从模型中进行推断的代码。这种关注点分离使您可以轻松地将经过 Amazon SageMaker 训练的模型部署到其他平台。
- 模型托管:一种带有 HTTP 端点的模型托管服务,用于调用您的模型以获得实时推论。这些端点可以扩展以支持流量,并允许您同时对多个模型进行 A/B 测试。同样,您可以使用内置 SDK 构建这些端点,也可以使用 Docker 映像提供自己的配置。Amazon SageMaker Neo:让客户只需训练一次模型,即可以高达 7 倍的性能在任意场景运行。在边缘的连接设备上运行的应用程序对于机器学习模型的性能尤其敏感。它们需要低延迟决策,通常部署在多种不同的硬件平台上。
- Amazon SageMaker Neo 针对特定硬件平台编译模型,自动优化模型性能,使它们能够以高达七倍的性能运行,而又确保精确性丝毫不打折扣。因此,开发者不再需要花费时间,根据每一个硬件平台手动调整他们已经训练过的模型(节约时间和成本)。SageMaker Neo 支持英伟达、英特尔、Xilinx、Cadence 和 Arm 硬件平台以及一些主流框架,如 Tensorflow、Apache MXNet 和 PyTorch。
- Amazon SageMaker GroundTruth:如果想要灵活地构建与管理您自己的数据标注工作流和人力资源,您可以使用 Amazon SageMaker Ground Truth。SageMaker Ground Truth 是一项数据标注服务,可简化数据标注,并提供使用可第三方供应商或您自己的专门团队的选项。您还可以生成标注合成数据,而无需手动收集或标注真实世界的数据。SageMaker Ground Truth 可以以您的名义生成数十万计自动标注的合成图像。
本文中的内容仅供参考。有关 Secret Cloud 中 Amazon Sagemaker 的更多信息,请联系我们。