Publicado en: Jul 13, 2018

Amazon SageMaker anuncia diversas mejoras en los algoritmos integrados DeepAR, BlazingText y aprendiz lineal. Chainer 4.1 se admite ahora en los contenedores preconfigurados dentro de Amazon SageMaker.

DeepAR se suele emplear para la previsión en casos de uso como mejorar las cadenas de suministro con mejores previsiones de demanda. Muchos conjuntos de datos incluyen datos incompletos que llevan a previsiones incorrectas. Con DeepAR en SageMaker, ahora los valores ausentes se gestionan dentro del modelo, haciendo la previsión más fácil y precisa mediante el uso del modelo de redes neuronales recurrentes (RNN). La segunda mejora en el algoritmo DeepAR es la capacidad de admitir características personalizadas variables en el tiempo, como patrones estacionales que cambian en niveles distintos de una jerarquía en diversas series temporales. En tercer lugar, DeepAR admite la agrupación de series temporales con varios atributos, también conocidas como agrupaciones múltiples. Con esta mejora, DeepAR puede aprender el comportamiento específico de un grupo, como patrones estacionales, para obtener mejores previsiones. Por último, se ha publicado un nuevo cuaderno que muestra cómo procesar un conjunto de datos reales en Amazon SageMaker con DeepAR. Este conjunto de datos incluye el consumo eléctrico por hora de 370 clientes, y se ha empleado en publicaciones académicas tales como “DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks” (DeepAR: Previsión probabilística con redes recurrentes autorregresivas). Para obtener más información sobre DeepAR en Amazon SageMaker, consulte la documentación aquí.

BlazingText proporciona una implementación optimizada del algoritmo Word2Vec para sacar partido del hardware de GPU. Este algoritmo aprende representaciones vectoriales distribuidas y de alta calidad de palabras dentro de una amplia colección de documentos. Esto se utiliza en tareas de procesamiento del lenguaje natural (NLP), tales como el análisis de opiniones y el reconocimiento de entidades. La primera mejora de BlazingText en SageMaker permite la generación de vectores significativos para palabras no presentes en el vocabulario (OOV) que no están incluidas en el conjunto de datos de entrenamiento. En segundo lugar, se admite la clasificación de alta velocidad de texto de varias clases y varias etiquetas con BlazingText. El objetivo de la clasificación de texto es clasificar automáticamente los documentos de texto en una o varias categorías definidas. Ahora, BlazingText puede entrenar en un par de minutos un modelo de clasificación de texto con más de mil millones de palabras. Para obtener más detalles sobre BlazingText en Amazon SageMaker, consulte la documentación aquí.

El algoritmo de aprendiz lineal de Amazon SageMaker admite ahora la clasificación de varias clases, además de la clasificación binaria y la regresión lineal. En esta tarea, se sabe que las salidas están en un conjunto finito de etiquetas. Por ejemplo: los mensajes de correo electrónico se podrían clasificar en categorías tales como bandeja de entrada, trabajo, personal, etc. Ya es posible utilizar el aprendiz lineal con este tipo de conjuntos de datos. Encontrará detalles sobre el aprendiz lineal aquí.

Los contenedores preconfigurados de Amazon SageMaker ahora admiten Chainer 4.1. Una característica clave de esta versión es el escalado de velocidad adaptativo por capa (LARS), que permite entrenar redes con lotes de gran tamaño.

Todas estas mejoras ya están disponibles en Amazon SageMaker en las regiones de AWS EE.UU. Este (Norte de Virginia), EE.UU. Este (Ohio), EE.UU. Oeste (Oregón), UE (Irlanda), UE (Fráncfort), Asia Pacífico (Tokio), Asia Pacífico (Seúl) y Asia Pacífico (Sídney).