Veröffentlicht am: Jul 13, 2018
Amazon SageMaker kündigt mehrere Verbesserungen der integrierten Algorithmen DeepAR, BlazingText und Linear Learner an. Chainer 4.1 wird jetzt auf den vorkonfigurierten Containern in Amazon SageMaker unterstützt.
DeepAR wird typischerweise für Prognosen in Anwendungsfällen wie einer verbesserten Lieferkette mit besseren Produktnachfrageprognosen verwendet. Viele Datensätze enthalten unvollständige Daten, die zu falschen Prognosen führen. Mit DeepAR in SageMaker werden nun fehlende Werte innerhalb des Modells behandelt, was die Prognose mithilfe des RNN-Modells (Recurrent Neural Networks) einfacher und genauer macht. Die zweite Erweiterung für den DeepAR-Algorithmus besteht in der Fähigkeit, benutzerdefinierte zeitvariable Funktionen wie Saisonabhängigkeitsmuster zu unterstützen, die auf verschiedenen Ebenen einer Hierarchie in verschiedenen Zeitreihen variieren. Drittens unterstützt DeepAR die Gruppierung von Zeitreihen mit mehreren Attributen, auch als Mehrfachgruppierungen bezeichnet. Mit dieser Verbesserung kann DeepAR gruppenspezifisches Verhalten wie Saisonalitätsmuster für bessere Prognosen lernen. Schließlich wurde ein neues Notebook veröffentlicht, das zeigen kann, wie man einen realen Datensatz auf Amazon SageMaker mit DeepAR verarbeitet. Dieser Datensatz besteht aus dem stündlichen Stromverbrauch von 370 Kunden, der in wissenschaftlichen Publikationen wie „DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks“ (Probabilistische Prognose mit autoregressiven rekurrenten Netzen) verwendet wurde. Weitere Informationen zu DeepAR in Amazon SageMaker finden Sie in der Dokumentation hier.
BlazingText bietet eine optimierte Implementierung des Word2Vec-Algorithmus, um die GPU-Hardware zu nutzen. Der Algorithmus lernt qualitativ hochwertige verteilte Vektordarstellungen von Wörtern in einer großen Sammlung von Dokumenten. Dies wird in NLP-Aufgaben (Natural Language Processing) wie Stimmungsanalyse und Entity Recognition verwendet. Die erste Erweiterung mit BlazingText in SageMaker ermöglicht die Generierung aussagekräftiger Vektoren für Wörter, die nicht im Vokabular (OOV) und Trainingsdatensatz enthalten sind. Zweitens wird mit BlazingText High-Speed-Multi-Class- und Multi-Label-Textklassifizierung unterstützt. Ziel der Textklassifizierung ist es, die Textdokumente automatisch in eine oder mehrere definierte Kategorien zu klassifizieren. BlazingText kann nun in wenigen Minuten ein Textklassifizierungsmodell für mehr als eine Milliarde Wörter trainieren. Weitere Informationen zu BlazingText in Amazon SageMaker finden Sie in der Dokumentation hier.
Der Linear Learner-Algorithmus in Amazon SageMaker unterstützt jetzt neben der binären Klassifizierung und der linearen Regression auch die Klassifizierung mehrerer Klassen. Dies ist eine Aufgabe, bei der bekannt ist, dass sich die Ausgaben in einer endlichen Menge von Labels befinden. Als ein Beispiel könnten E-Mails als Posteingang, Arbeit, Personal usw. klassifiziert werden. Linear Learner kann jetzt für solche Datensätze verwendet werden. Details zu Linear Learner finden Sie hier.
Die vorkonfigurierten Container von Amazon SageMaker unterstützen nun Chainer 4.1. Ein Schlüsselmerkmal in dieser Version ist das Layer-Wise Adaptive Rate Scaling (LARS), mit dem Sie Netzwerke mit großen Batch-Größen trainieren können.
Alle diese Verbesserungen sind jetzt in Amazon SageMaker in den AWS-Regionen USA Ost (Nord-Virginia), USA Ost (Ohio), USA West (Oregon), Europa (Irland), Europa (Frankfurt), Asien-Pazifik (Tokio), Asien-Pazifik ( Seoul) und Asien-Pazifik (Sydney) verfügbar.