Publicado en: Jan 18, 2018
Ya puede utilizar la implementación de BlazingText de Amazon SageMaker del algoritmo Word2Vec para generar incrustaciones de palabras a partir de un gran número de documentos. Las incrustaciones de palabras representan cada palabra única en una colección entera de documentos de texto como un vector de números. Las palabras que son similares tendrán vectores similares, es decir, estarán cerca en el espacio de baja dimensionalidad de las incrustaciones, mientras que las palabras que se parezcan menos estarán más separadas. Este algoritmo se utiliza en diversas tareas para la comprensión del lenguaje natural (en inglés, Natural Language Understanding, NLU) tales como el análisis de similitud semántica, análisis del sentimiento, traducción automática y sistemas de respuestas. Asimismo, se ha usado recientemente Word2Vec con éxito en tareas como la recomendación y la segmentación, en donde incrustaciones parecidas pueden sugerir, por ejemplo, que hay dos películas que tienden a ser vistas por usuarios parecidos en tiempos parecidos. La implementación de BlazingText de Amazon SageMaker se ha diseñado prestando especial atención a la velocidad y al escalado para producir incrustaciones extremadamente rápidas utilizando el hardware de la CPU o la GPU.
La implementación del algoritmo Word2Vec en BlazingText está disponible en las regiones de AWS de EE.UU. Este (Norte de Virginia y Ohio), UE (Irlanda) y EE.UU. Oeste (Oregón). Para saber más, visite la documentación para Word2Vec en BlazingText de Amazon SageMaker.