張貼日期: Jul 13, 2018
Amazon SageMaker 宣布 DeepAR、BlazingText 與 Linear Learner 等內建演算法的多項增強功能。Amazon SageMaker 內已預先設定的容器現在支援 Chainer 4.1。
DeepAR 通常作預測用途,例如透過更佳的產品需求預測來改善供應鏈等使用案例。許多資料集包含不完整的資料,導致不正確的預測。SageMaker 內建的 DeepAR 利用循環神經網路 (RNN) 模型,在模型內即可處理遺漏值,使得預測更加容易且更為精準。DeepAR 演算法的第二項增強功能,是能夠支援自訂的時變功能,例如可跨越不同時間序列,找出隨階層的不同層級變動的季節性模式。第三項增強功能是 DeepAR 支援以多屬性分組時間序列,亦稱為多群組。有了這項增強功能,DeepAR 可以學習季節性模式等群組特定行為,以提供更佳的預測。最後,發表全新的筆記本,展示如何以 DeepAR 處理 Amazon SageMaker 上的真實世界資料集。這個資料集包含 370 位客戶的逐時電力用量資料,且已用於學術發表,例如「DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks」。如需進一步了解 Amazon SageMaker 的 DeepAR,請參閱這裡的說明文件。
BlazingText 提供 Word2Vec 演算法的最佳化實作,以充分利用 GPU 硬體效能。這套演算法會在大量文件集之中,學習高品質的分散式字詞向量表徵。這被用於文本情感分析與實體識別等自然語言處理 (NLP) 作業上。SageMaker 中的第一項 BlazingText 增強功能,可針對並未出現在訓練資料集中的未知詞 (OOV word) 產生有意義的向量。第二項增強功能,則是 BlazingText 支援高速的多類別與多標籤文字分類。文字分類的目標,是要自動將文字文件分類成一或多個定義的類別。現在,BlazingText 可在數分鐘內,以上百億個字詞訓練文字分類模型。如需進一步了解 Amazon SageMaker 的 BlazingText,請參閱這裡的說明文件。
Amazon SageMaker 中的 Linear Learner 演算法除支援二進位分類與線性迴歸,現在支援多類別分類。這類作業的輸出結果已知會出現在有限的標籤集中。舉例來說,電子郵件可歸類為收件匣、工作、私人等類別。Linear Learner 現在可用於這類資料集中。您可在這裡找到 Linear Learner 的詳細資訊。
Amazon SageMaker 的預先設定容器現在支援 Chainer 4.1。此版本的重要功能是 Layer-wise Adaptive Rate Scaling (LARS),可讓您以大批量來訓練網路。
現在起,美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (奧勒岡)、歐洲 (愛爾蘭)、歐洲 (法蘭克福)、亞太區域 (東京)、亞太區域 (首爾) 及亞太區域 (雪梨) 等 AWS 區域的 Amazon SageMaker 均已開放使用所有這些增強功能。