Anúncio de Dynamic Resource Allocation do Kubernetes para o Elastic Fabric Adapter
O Amazon Elastic Kubernetes Service (Amazon EKS) agora oferece suporte a Dynamic Resource Allocation (DRA) para o Elastic Fabric Adapter (EFA), para simplificar a comunicação de alta performance entre nós e o RDMA (Remote Direct Memory Access) para workloads de inteligência artificial, machine learning e computação de alta performance (HPC). O driver EFA DRA, desenvolvido no projeto DRANET upstream, oferece compartilhamento de interface do EFA e alocação com reconhecimento de topologia para workloads executadas no Kubernetes.
Com o driver EFA DRA, você pode alocar interfaces do EFA e dispositivos aceleradores que compartilham a mesma raiz de PCIe ou grupo de dispositivos, o que garante que o tráfego entre nós use a interface de rede mais próxima de cada GPU NVIDIA, AWS Trainium ou dispositivo do AWS Inferentia presente no nó. O driver EFA DRA também permite compartilhar a interface do EFA entre workloads no mesmo nó para maximizar a utilização da interface do EFA.
O driver EFA DRA é recomendado para novas implantações em clusters do Amazon EKS que estejam executando o Kubernetes versão 1.34 ou posterior com grupos de nós gerenciados pelo EKS ou nós autogerenciados. O driver EFA DRA está disponível em todas as regiões da AWS que oferecem o Amazon EKS. O plug-in de dispositivo do EFA continua sendo compatível e é a opção recomendada quando você usa o Karpenter e o Modo automático do Amazon EKS.
Para saber mais, consulte Manage EFA devices on Amazon EKS no Guia do usuário do Amazon EKS.