AWS anuncia a atualização da EFA para oferecer escalabilidade com aplicações de IA/ML

Publicado: 24 de out de 2024

A AWS anuncia o lançamento de um novo tipo de interface que desacopla o Elastic Fabric Adapter (EFA) do Adaptador de Rede Elástica (ENA). O EFA fornece redes de alta largura de banda e baixa latência, cruciais para escalar workloads de IA/ML. A nova interface, “Somente EFA”, permite criar um dispositivo EFA autônomo em interfaces secundárias. Dessa forma, você pode escalar clusters de computação para executar aplicações de IA/ML sem sobrecarregar seu espaço de endereços IPv4 privados ou enfrentar desafios de roteamento de IP associados ao Linux.

Anteriormente, cada interface EFA era acoplada a um dispositivo ENA, que consumia um endereço IP. Isso pode resultar em um limite de escala para o crescimento de trabalhos de treinamento de modelos de IA/ML. O Linux também podia apresentar desafios de roteamento quando várias interfaces com IPs privados eram usadas, como perda de pacotes devido à incompatibilidade do IP de origem e problemas de mapeamento de nomes de host. As interfaces somente EFA resolvem esses desafios, já que o dispositivo EFA não recebe um endereço IP porque usa o protocolo Scalable Reliable Datagram (SRD), que opera com endereços MAC. As interfaces somente EFA só podem ser configuradas como interfaces secundárias. A interface primária deve ser a EFA acoplada à ENA ou apenas a ENA, já que é necessária para o roteamento de TCP/IP nas VPCs.

As interfaces somente EFA estão disponíveis em todas as instâncias com suporte da EFA em todas as regiões da AWS, incluindo as regiões AWS GovCloud (EUA) e China. Você pode ativar a EFA sem custo adicional para executar workloads de IA/ML em grande escala. Para saber mais, consulte a documentação da EFA.