Anunciamos la asignación dinámica de recursos de Kubernetes para Elastic Fabric Adapter
Amazon Elastic Kubernetes Service (Amazon EKS) ahora admite la asignación dinámica de recursos (DRA) para Elastic Fabric Adapter (EFA), lo que simplifica la comunicación entre nodos de alto rendimiento y el RDMA (acceso remoto directo a la memoria) para cargas de trabajo de inteligencia artificial, machine learning y computación de alto rendimiento (HPC). El controlador de DRA para EFA, basado en el proyecto DRANET anterior, permite el uso compartido de interfaces de EFA y la asignación teniendo en cuenta la topología para las cargas de trabajo que se ejecutan en Kubernetes.
Con el controlador de DRA para EFA, puede asignar interfaces EFA y dispositivos aceleradores que compartan la misma raíz o grupo de dispositivos PCIe, garantizando que el tráfico entre nodos fluya a través de la interfaz de red más cercana a cada GPU de NVIDIA, AWS Trainium o dispositivo de AWS Inferentia en el nodo. El controlador de DRA para EFA también admite el uso compartido de interfaces de EFA entre cargas de trabajo del mismo nodo para maximizar la utilización de la interfaz de EFA.
Se recomienda el controlador de DRA para EFA para nuevas implementaciones en clústeres de Amazon EKS que ejecuten Kubernetes versión 1.34 o posterior con grupos de nodos administrados por EKS o nodos autoadministrados. El controlador de DRA para EFA está disponible en todas las regiones de AWS en las que Amazon EKS está disponible. El complemento del dispositivo EFA sigue siendo compatible y se recomienda su uso con Karpenter y Amazon EKS Auto Mode.
Para obtener más información, consulte Administrar dispositivos EFA en Amazon EKS en la Guía del usuario de Amazon EKS.