AWS anuncia la actualización del EFA para la escalabilidad con aplicaciones de IA/ML

Publicado en: 24 de oct de 2024

AWS anuncia el lanzamiento de un nuevo tipo de interfaz que desacopla el Elastic Fabric Adapter (EFA) del Elastic Network Adapter (ENA). El EFA proporciona redes de gran ancho de banda y baja latencia, fundamentales para escalar las cargas de trabajo de IA/ML. La nueva interfaz, “solo EFA”, permite crear un dispositivo EFA independiente en las interfaces secundarias. Esto le permite escalar sus clústeres de procesamiento para ejecutar aplicaciones de IA/ML sin agotar su espacio de direcciones IPv4 privadas ni enfrentarse a los desafíos de enrutamiento IP asociados con Linux.

Anteriormente, cada interfaz de EFA estaba acoplada a un dispositivo de ENA, que consumía una dirección IP. Esto podría resultar en un límite de escala para los crecientes trabajos de entrenamiento de modelos de AI/ML. Linux también podría presentar problemas de enrutamiento cuando se utilizaban varias interfaces con IP privadas, como la pérdida de paquetes debido a la falta de coincidencia de la IP de origen y a problemas de asignación de nombres de host. Las interfaces exclusivas para EFA resuelven estos desafíos, ya que al dispositivo de EFA no se le asigna una dirección IP porque utiliza el protocolo Scalable Reliable Datagram (SRD), que funciona a través de direcciones MAC. Las interfaces exclusivas de EFA solo se pueden configurar como una interfaz secundaria y la interfaz principal es EFA acoplada con ENA o solo ENA, ya que ENA es necesario para el enrutamiento de VPC TCP/IP.

El EFA solo está disponible en todas las instancias compatibles con este adaptador en todas las regiones de AWS, incluidas las regiones de AWS GovCloud (EE. UU.) y las regiones de AWS China. Puede habilitar el EFA sin costo adicional para ejecutar sus cargas de trabajo de IA/ML a escala. Para obtener más información, consulte la documentación del EFS.