Annonce de l’allocation dynamique des ressources de Kubernetes pour Elastic Fabric Adapter
Amazon Elastic Kubernetes Service (Amazon EKS) prend désormais en charge l’allocation dynamique des ressources (DRA) pour Elastic Fabric Adapter (EFA), simplifiant ainsi les communications hautes performances entre les nœuds et le RDMA (Remote Direct Memory Access) pour les charges de travail liées à l’intelligence artificielle, au machine learning et au calcul haute performance (HPC). Le pilote EFA DRA, basé sur le projet DRANET en amont, permet le partage d’interface EFA et l’allocation tenant compte de la topologie pour les charges de travail exécutées sur Kubernetes.
Avec le pilote EFA DRA, vous pouvez attribuer des interfaces EFA et des dispositifs accélérateurs qui partagent la même racine PCIe ou le même groupe de périphériques, en veillant à ce que le trafic inter-nœuds circule via l’interface réseau la plus proche de chaque GPU NVIDIA, AWS Trainium ou périphérique AWS Inferentia sur le nœud. Le pilote EFA DRA prend également en charge le partage d’interface EFA entre les charges de travail sur le même nœud afin de maximiser l’utilisation de l’interface EFA.
Le pilote EFA DRA est recommandé pour les nouveaux déploiements sur des clusters Amazon EKS exécutant Kubernetes version 1.34 ou ultérieure avec des groupes de nœuds gérés par EKS ou des nœuds autogérés. Le pilote EFA DRA est disponible dans toutes les Régions AWS où Amazon EKS est disponible. Le plug-in d’appareil EFA reste pris en charge et il est recommandé de l’utiliser avec Karpenter et le mode automatique d’Amazon EKS.
Pour en savoir plus, consultez Gérer les appareils EFA sur Amazon EKS dans le Guide de l’utilisateur d’Amazon EKS.