Publié le: Jul 13, 2018
Amazon SageMaker annonce plusieurs améliorations aux algorithmes intégrés DeepAR, BlazingText et Linear Learner. Chainer 4.1 est désormais pris en charge sur les conteneurs préconfigurés dans Amazon SageMaker.
DeepAR est généralement utilisé comme outil de prévision dans les cas d'utilisation, par exemple pour améliorer les chaînes d'approvisionnement avec de meilleures prévisions de la demande en produit. De nombreux ensembles de données ne sont pas suffisamment complets, ce qui conduit à des prévisions incorrectes. Avec DeepAR dans SageMaker, les valeurs manquantes sont désormais gérées au sein du modèle, ce qui rend les prévisions plus faciles et plus précises avec l'utilisation du modèle de réseaux neuronaux récurrents (RNN).l'utilisation La deuxième amélioration pour l'algorithme DeepAR réside dans la capacité de prendre en charge des fonctions personnalisées variables dans le temps telles que des schémas saisonniers qui varient à différents niveaux d'une hiérarchie parmi des données en séries chronologiques. Troisièmement, DeepAR prend en charge le regroupement de séries chronologiques aux multiples attributs, également connues sous le nom de groupements multiples. Avec cette amélioration, DeepAR peut apprendre un comportement spécifique à un groupe tel que des schémas saisonniers pour améliorer les prévisions. Enfin, un nouvel ordinateur portable qui peut montrer comment traiter un ensemble de données réelles sur Amazon SageMaker avec DeepAR a été mis en service. Cet ensemble de données correspond à une consommation électrique horaire de 370 consommateurs ayant été mentionnée dans des publications académiques telles que « DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks ». Pour plus d’informations concernant DeepAR dans Amazon SageMaker, consultez cette documentation.
BlazingText apporte une optimisation de la mise en œuvre de l'algorithme Word2Vec qui permet de tirer profit du matériel GPU. L'algorithme apprend des représentations vectorielles de mots distribuées de grande qualité dans un grand ensemble de documents. Il est utilisé dans des tâches de traitement automatique de langue naturelle (TALN) telles que l'analyse de sentiment et la reconnaissance d'entités. La première amélioration issue de BlazingText dans SageMaker permet la génération de vecteurs cohérents de mots hors vocabulaires n’apparaissant pas dans les ensembles de données de formation. Deuxièmement, BlazingText prend en charge la classification des textes multiclasses et multiétiquette ultrarapide. L'objectif de la classification de texte est de classer automatiquement les documents de texte en une ou plusieurs catégories définies. BlazingText peut maintenant former un modèle de classification de texte sur plus d'un milliard de mots en quelques minutes. Pour plus de détails concernant BlazingText dans Amazon SageMaker, consultez cette documentation.
L'algorithme Linear Learner dans Amazon SageMaker prend désormais en charge la classification multiclasse, en plus de la classification binaire et la régression linéaire. Il s'agit d'une tâche dont le résultat attendu est un ensemble fini d'étiquettes. Par exemple, les courriers électroniques peuvent être classés dans boîte de réception, travail, personnel, etc. Linear Learner peut maintenant être utilisé pour de tels ensembles de données. Vous trouverez des détails sur Linear Learner ici.
Les conteneurs préconfigurés d’Amazon SageMaker prennent désormais en charge Chainer 4.1. LARS (Layer-wise adaptive Rate Scaling) est une caractéristique clé de cette version, il vous permet de former des réseaux avec des lots de grande taille.
Toutes ces améliorations sont désormais disponibles dans Amazon SageMaker dans les régions AWS suivantes : USA Est (Virginie du Nord), USA Est (Ohio), USA Ouest (Oregon), UE (Irlande), UE (Francfort), Asie-Pacifique (Tokyo), Asie-Pacifique (Séoul) et Asie-Pacifique (Sydney).