Inserito il: Jul 13, 2018

Amazon SageMaker annuncia numerosi miglioramenti agli algoritmi DeepAR, BlazingText e Linear Learner integrati. Chainer 4.1 ora è supportato dai contenitori preconfigurati in Amazon SageMaker.

DeepAR normalmente viene utilizzato per prevedere i casi d'uso come supply chain migliorata con una previsione migliore della domanda di prodotto. Molti set di dati hanno dati incompleti che portano a previsioni sbagliate. Con DeepAR in SageMaker i valori mancanti ora vengono gestiti dentro al modello, semplificando le previsioni e rendendole più accurate, grazie all'utilizzo del modello di rete neurale ricorrente (RNN, Recurrent Neural Networks). Il secondo miglioramento per gli algoritmi DeepAR è la possibilità di supportare funzionalità variabili nel tempo personalizzate come i modelli stagionali, che variano su livelli di versi di una gerarchia tra diverse serie temporali. Terzo, DeepAR supporta il raggruppamento delle serie temporali con più attributi, anche noti come raggruppamenti multiplo. Con questo miglioramento, DeepAR può imparare comportamenti specifici di un gruppo, come i modelli stagionali, per migliorare le previsioni. Infine, è stato pubblicato un nuovo manuale per mostra come elaborare un set di dati reale su Amazon SageMaker con DeepAR. Questo set di dati comprende il consumo orario di elettricità da parte di 370 clienti ed è stato usato in pubblicazioni accademiche come "DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks". Per ulteriori informazioni su DeepAR in Amazon SageMaker consulta la documentazione qui.

BlazingText fornisce un'implementazione ottimizzata dell'algoritmo Word2Vec per sfruttare l'hardware GPU. L'algoritmo impara le rappresentazioni vettoriali distribuite di alta qualità delle parole da una vasta collezione di documenti. Questo viene usato nelle attività di elaborazione del linguaggio naturale (NLP, Natural Language Processing) come analisi delle sensazioni e riconoscimento delle identità. Il primo miglioramento con BlazingText in SageMaker permette la generazione di vettori con significato per le parole fuori dal vocabolario (OOV, out-of-vocabulary) che non compaiono nei set di dati di training. Secondo, la classificazione del testo multi-classe e multi-etichetta ad alta velocità supportata con BlazingText. L'obbiettivo della classificazione del testo è di classificare automaticamente i documenti di testo in una o più categorie definite. BlazingText ora può eseguire il training su un modello di classificazione del testo su più di un miliardo di parole in un paio di minuti. Per ulteriori informazioni su BlazingText in Amazon SageMaker consulta la documentazione qui.

L'algoritmo Linear Learner in Amazon SageMaker ora supporta la classificazione multi-classe, oltre alla classificazione binaria e la regressione lineare. Questa è un'attività in cui gli output sono conosciuti e in un set finito di etichette. Per esempio, le email possono essere classificate come in arrivo, lavoro, personale, ecc. Linear Learner ora può essere utilizzato per questi set di dati. Puoi scoprire i dettagli di Linear Learner qui.

I contenitori preconfigurati di Amazon SageMaker ora supportano Chainer 4.1. Una funzionalità chiave di questa versione è Layer-wise Adaptive Rate Scaling (LARS) che permette di testare le reti con le dimensioni di grandi batch.

Tutti questi miglioramenti sono ora disponibili in Amazon SageMaker nelle regioni AWS di Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio), Stati Uniti occidentali (Oregon), Europa (Irlanda), Europa (Francoforte), Asia Pacifico (Tokyo), Asia Pacifico (Seoul) e Asia Pacifico (Sydney).