Publicado en: Nov 1, 2017
Ya está disponible la versión 0.12 de Apache MXNet, con dos nuevas e importantes características: compatibilidad con GPU NVIDIA Volta y con tensores dispersos.
Compatibilidad con arquitectura de GPU NVIDIA Volta
La versión 0.12 de MXNet admite compatibilidad con GPU NVIDIA Volta V100 para permitir a los clientes entrenar redes neuronales convolucionales hasta 3,5 veces más rápido que con GPU Pascal. La arquitectura de GPU Volta presenta el nuevo núcleo Tensor, que permite realizar entrenamientos de precisión mixta. Gracias a la precisión mixta de los núcleos Tensor, los usuarios pueden lograr no solo un entrenamiento desempeño óptimo sin sacrificar precisión al usar FP16 en la mayoría de las capas de una red, sino también tipos de datos más precisos cuando sea necesario. Benefíciese de los núcleos Tensor de Volta para habilitar entrenamientos FP16 en MXNet con solo pasar un comando.
Recientemente anunciamos un nuevo conjunto de AMI de AWS Deep Learning, que incluye marcos de trabajo de aprendizaje profundo optimizados (entre ellos, MXNet versión 0.12) preinstalados para GPU NVIDIA Volta V100 en la nueva familia de instancias P3 de Amazon EC2. Puede empezar con un solo clic desde AWS Marketplace o seguir esta guía paso a paso para comenzar a utilizar su primer bloc de notas.
Compatibilidad con tensores dispersos
MXNet versión 0.12 ahora incluye compatibilidad con tensores dispersos, para almacenar y calcular de forma eficiente tensores que permitan a los desarrolladores realizar operaciones con matrices dispersas eficientemente en términos de almacenamiento y cálculo, y entrenar modelos de aprendizaje profundo más rápido. Este lanzamiento admite dos formatos principales de datos dispersos: fila dispersa comprimida (CSR) y fila dispersa (RSP). El formato CSR está optimizado para representar matrices con una cantidad elevada de columnas, en la que cada fila tiene solo unos pocos elementos distintos de cero. El formato RSP está optimizado para representar matrices con una cantidad enorme de filas, de las cuales los sectores de la mayoría de ellas son ceros. Esta versión habilita compatibilidad con dispersión en CPU para los operadores usados más frecuentemente, como multiplicación escalar y operadores algebraicos. En versiones posteriores se añadirá compatibilidad con más operadores para matrices dispersas.
Consulte estos tutoriales para aprender a utilizar los nuevos operadores para matrices dispersas en MXNet.