Publicado en: Aug 13, 2021
AWS Neuron, el SDK para ejecutar inferencias para machine learning en las instancias Inf1 de Amazon EC2 basadas en AWS Inferentia ahora es compatible con TensorFlow 2. A partir de Neuron 1.15.0, puede ejecutar sus modelos basados en TensorFlow 2 BERT en instancias Inf1, y próximamente con compatibilidad con modelos adicionales. Para obtener más información sobre la compatibilidad de Neuron con TensorFlow 2, visite la página de preguntas frecuentes de TensorFlow 2.
También hemos actualizado nuestros recursos con nueva documentación incluido un tutorial que le ayuda a comenzar con TensorFlow 2, un tutorial que le guiará sobre cómo implementar un contenedor de modelos HuggingFace BERT en Inferentia mediante el hosting de AWS Sagemaker, la página de rendimiento de inferencia para ayudarle a comparar y replicar nuestros resultados y una nueva nota de aplicación para ayudarle a descubrir los tipos de arquitecturas de aprendizaje profundo que tendrán un buen rendimiento de inmediato en Inferentia.
AWS Neuron se integra de forma nativa con marcos populares de ML, como TensorFlow, PyTorch y Apache MXNet. Incluye un compilador de aprendizaje profundo, un tiempo de ejecución y herramientas que le ayudan a obtener el máximo rendimiento en sus aplicaciones. Para obtener más información, visite la página de AWS Neuron y la documentación de AWS Neuron.
Las instancias Inf1 de Amazon EC2 ofrecen el menor costo para inferencias de aprendizaje profundo en la nube y están disponibles en 23 regiones, que incluye EE. UU. Este (Norte de Virginia y Ohio), EE. UU. Oeste (Oregón, Norte de California), AWS GovCloud (EE. UU. Este y EE. UU. Oeste), Canadá (Central), Europa (Fráncfort, Irlanda, Londres, Milán, París y Estocolmo), Asia-Pacífico (Hong Kong, Bombay, Seúl, Singapur, Sídney, Tokio), Medio Oriente (Baréin) y América del Sur (São Paulo) y China (Pekín y Ningxia). Puede beneficiarse de las instancias Inf1 de Amazon EC2 en la región que mejor cumpla sus requisitos de latencia en tiempo real para la inferencia de machine learning. Para obtener más información, visite la página sobre las instancias Inf1 de Amazon EC2.