Publicado: Jul 13, 2018
O Amazon SageMaker anuncia vários aprimoramentos dos algoritmos integrados DeepAR, BlazingText e Linear Learner. O Chainer 4.1 agora oferece suporte nos contêineres pré-configurados no Amazon SageMaker.
O DeepAR é normalmente usado para previsão em casos de uso, como aprimoramentos na cadeia de suprimentos, com melhores previsões de demanda do produto. Muitos conjuntos de dados vêm com dados incompletos, resultando em previsões incorretas. Com o DeepAR no SageMaker, os valores ausentes agora são manipulados dentro do modelo, tornando a previsão mais fácil e mais precisa, utilizando o modelo de Recurrent Neural Networks (RNN – Redes neurais recorrentes). O segundo aprimoramento do algoritmo DeepAR é a capacidade de oferecer suporte a recursos personalizados que variam no tempo, como padrões de sazonalidade que variam em diferentes níveis de hierarquia em diferentes séries temporais. Em terceiro lugar, o DeepAR oferece suporte ao agrupamento de séries temporais com vários atributos, também conhecidos como agrupamentos múltiplos. Com esse aprimoramento, o DeepAR pode aprender o comportamento específico do grupo, como padrões de sazonalidade para melhores previsões. Por fim, um novo notebook que mostra como processar um conjunto de dados do mundo real no Amazon SageMaker com DeepAR foi lançado. Este conjunto de dados consiste no consumo de eletricidade por hora de 370 clientes que usou publicações acadêmicas, como “DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks”. Para obter mais informações sobre o DeepAR no Amazon SageMaker, consulte a documentação aqui.
O BlazingText fornece uma implementação otimizada do algoritmo Word2Vec para aproveitar o hardware da GPU. O algoritmo aprende representações vetoriais distribuídas de alta qualidade de palavras em um grande conjunto de documentos. Isso é usado em tarefas de processamento de linguagem natural (NLP), como análise de sentimento e reconhecimento de entidade. O primeiro aprimoramento com o BlazingText no SageMaker permite a geração de vetores significativos para palavras out-of-vocabulary (OOV – fora do vocabulário) que não aparecem no conjunto de dados de treinamento. Em segundo lugar, há suporte para a classificação de texto de várias classes e vários rótulos de alta velocidade no BlazingText. O objetivo da classificação de texto é classificar automaticamente os documentos de texto em uma ou mais categorias definidas. O BlazingText agora pode treinar um modelo de classificação de texto em mais de um bilhão de palavras em alguns minutos. Para obter mais detalhes sobre o BlazingText no Amazon SageMaker, veja a documentação aqui.
O algoritmo Linear Learner no Amazon SageMaker agora oferece suporte a classificação de várias classes, além de classificação binária e regressão linear. Esta é uma tarefa em que as saídas são conhecidas por estarem em um conjunto finito de rótulos. Por exemplo, os e-mails podem ser classificados como caixa de entrada, trabalho, pessoal, etc. O Linear Learner agora pode ser usado para esses conjuntos de dados. Detalhes do Linear Learner podem ser encontrados aqui.
Os contêineres pré-configurados do Amazon SageMaker agora oferecem suporte ao Chainer 4.1. Um recurso importante nessa versão é o Layer-wise Adaptive Rate Scaling (LARS) que permite treinar redes com grandes tamanhos de lote.
Todas essas melhorias agora estão disponíveis no Amazon SageMaker nas regiões Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Europa (Irlanda), Europa (Frankfurt), Ásia-Pacífico (Tóquio), Ásia-Pacífico (Seul) e Ásia-Pacífico (Sydney) da AWS.