投稿日: Jul 13, 2018
Amazon SageMaker は、ビルトイン DeepAR 、BlazingText 、および Linear Learner アルゴリズムへの機能拡張を発表しました。Chainer 4.1 は、Amazon SageMaker 内のあらかじめ設定してあるコンテナで利用可能となりました。
DeepAR は通常、より正確な製品需要予測を含むサプライチェーンの改善などのユースケースの予測に使用されます。多くのデータセットには不完全なデータが含まれているので、予測が正しく行われません。SageMaker の DeepAR を使用すると、欠測値がモデル内で処理されるため、再帰型ニューラルネットワーク (RNN) モデルを使用することで、予測をより簡単で正確に行うことができるようになりました。DeepAR アルゴリズムの 2 つ目の拡張機能は、異なる時系列にわたる階層の様々なレベルにおいて変化する季節パターンのような、カスタムの時間変化の機能をサポートするものです。3 つ目の拡張は、DeepAR が複数のグループ化としても知られる、複数の属性を持つ時系列のグループ化のサポートです。この拡張機能により、DeepAR はより正確な予測のために季節のパターンなどのグループ固有の動作を学習するようになりました。最後に、DeepAR を使った Amazon SageMaker 上の実在のデータセットを処理する方法を表示した、新しいノートブックをリリースしました。このデータセットは、370 人の顧客の 1 時間あたりの電力消費量で構成されたもので、これには「 DeepAR : 自己回帰的再帰型ネットワークを用いた確率的予測」といった学術記事が使用されています。Amazon SageMaker の DeepAR に関する詳細は、「ドキュメントはこちら」をご参照ください。
BlazingText は、GPU ハードウェアを活用することで、Word2Vec アルゴリズムを最適に実装することができます。このアルゴリズムは、大量の文書内の単語を、分散するベクトルを使って高い品質で表現することを学びます。こうしたアルゴリズムは、センチメント分析やエンティティ認識といった自然言語処理 (NLP) のタスクで使用されます。SageMaker の BlazingText を使用した 1 つ目の拡張機能により、トレーニングデータセットには表示されない未定義語 (OOV) に意味を持つベクトルを生成することが可能となります。2 つ目に、高速マルチクラスおよびマルチラベルのテキスト分類が BlazingText でサポートされるようになりました。テキスト分類の目的は、定義してある複数のカテゴリに、テキスト文書を自動的に分類することです。BlazingText では、数分で 10 億語以上のテキスト分類モデルをトレーニングできるようになりました。Amazon SageMaker の BlazingText に関する詳細は、「ドキュメントはこちら」をご参照ください。
Amazon SageMaker の Linear Learner アルゴリズムは、バイナリ分類と線形回帰に加えて、マルチクラス分類をサポートするようになりました。これは、出力が有限のラベルセットに含まれることが分かっている時のタスクです。例えば、電子メールは受信トレイ、仕事、個人などに分類されます。Linear Learner をこうしたデータセットに使用できるようになりました。Linear Learner の詳細はこちらをご参照ください。
Amazon SageMaker のあらかじめ設定してあるコンテナが、Chainer 4.1 をサポートするようになりました。このバージョンの主な機能は、Layer-wise Adaptive Rate Scaling (LARS) で、これで大規模なバッチサイズのネットワークをトレーニングできるようになりました。
これら全ての機能拡張は、米国東部 ( バージニア北部 ) 、米国東部 ( オハイオ ) 、米国西部 ( オレゴン ) 、欧州 ( アイルランド ) 、欧州 ( フランクフルト ) 、アジアパシフィック ( 東京 ) 、アジアパシフィック ( ソウル ) 、アジアパシフィック ( シドニー ) の AWS リージョンの Amazon SageMaker にて利用可能です。