发布于: Jul 13, 2018

Amazon SageMaker 宣布内置 DeepAR、BlazingText 和 Linear Learner 算法的多项增强。Amazon SageMaker 内的预配置容器现支持 Chainer 4.1。

DeepAR 通常用于预测使用案例,例如通过更好的产品需求预测来改进供应链。许多数据集的数据都不完整,进而导致预测不正确。在 SageMaker 中使用 DeepAR,现在可以在模型中处理缺失值,通过使用递归神经网络 (RNN) 模型使预测更容易、更准确。DeepAR 算法的第二项增强是支持自定义时变特征,例如在涵盖不同时间序列的层次结构的不同级别上变化的季节性模式。第三,DeepAR 支持使用多个属性对时间序列进行分组,这也称为多重分组。通过此增强,DeepAR 可以学习特定于组的行为,例如季节性模式等,以实现更好的预测。最后,采用 DeepAR 的 Amazon SageMaker 中还推出了一款可以展示如何处理现实数据集的新笔记本。该数据集包括一直在使用学术出版物的 370 位客户的每小时电力消耗,例如 DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks。有关 Amazon SageMaker 中 DeepAR 的更多信息,请参见此处的文档

BlazingText 提供了 Word2Vec 算法的优化实现,旨在充分利用 GPU 硬件。该算法在大量文档和中学习单词的高质量分布式矢量表示。此信息用于自然语言处理 (NLP) 任务,例如情感分析和实体识别。SageMaker 中 BlazingText 的第一项增强可以为训练数据集中没有出现的词典外 (OOV) 单词生成有意义的矢量。其次,BlazingText 支持高速多类和多标签文本分类。文本分类的目标是自动将文本文档分类为一个或多个已定义的类别。BlazingText 现在可以在几分钟内训练超过十亿字的文本分类模型。有关 Amazon SageMaker 中 BlazingText 的更多详细信息,请参见此处的文档

除了二进制分类和线性回归之外,Amazon SageMaker 中的 Linear Learner 算法现在还支持多类分类。在这项任务中,输出在一个有限标签组的范围内。例如,电子邮件可以分类为收件箱、工作、个人等。Linear Learner 现在可用于此类数据集。在此处可以找到 Linear Learner 的详细信息。

Amazon SageMaker 的预配置容器现在支持 Chainer 4.1。此版本的一个关键功能是逐层自适应速率扩展 (LARS),这项功能允许您训练批量规模较大的网络。

这些增强现已在以下地区的 Amazon SageMaker 中推出:美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(俄勒冈)、欧洲(爱尔兰)、欧洲(法兰克福)、亚太地区(东京)、亚太地区(首尔)和亚太地区(悉尼)。