AWS kündigt EFA-Update für Skalierbarkeit von KI-/ML-Anwendungen an

Veröffentlicht am: 24. Okt. 2024

AWS kündigt die Einführung eines neuen Schnittstellentyps an, der den Elastic Fabric Adapter (EFA) vom Elastic Network Adapter (ENA) entkoppelt. EFA bietet Netzwerke mit hoher Bandbreite und niedriger Latenz, die für die Skalierung von KI/ML-Workloads unerlässlich sind. Die neue Schnittstelle, „EFA-only“, ermöglicht es Ihnen, ein eigenständiges EFA-Gerät auf sekundären Schnittstellen zu erstellen. Auf diese Weise können Sie Ihre Compute-Cluster skalieren, um KI/ML-Anwendungen auszuführen, ohne Ihren privaten IPv4-Adressraum zu belasten oder auf IP-Routing-Probleme im Zusammenhang mit Linux zu stoßen.

Bisher war jede EFA-Schnittstelle mit einem ENA-Gerät gekoppelt, das eine IP-Adresse verbrauchte. Dies könnte bei einer wachsenden Anzahl an KI-/ML-Modelltrainingsjobs zu einer Skalierungsgrenze führen. Linux könnte auch Routing-Probleme mit sich bringen, wenn mehrere Schnittstellen mit privaten IP-Adressen verwendet wurden, wie z. B. Paketverluste aufgrund von Quell-IP-Adressen und Problemen bei der Hostnamenzuordnung. Nur-EFA-Schnittstellen lösen diese Herausforderungen, da dem EFA-Gerät keine IP-Adresse zugewiesen wird: Es verwendet das Scalable Reliable Datagram-Protokoll (SRD), das über MAC-Adressen arbeitet. Nur-EFA-Schnittstellen können nur als sekundäre Schnittstelle konfiguriert werden, wobei die primäre Schnittstelle entweder EFA in Verbindung mit ENA oder nur ENA ist, da ENA für das TCP/IP-VPC-Routing erforderlich ist.

Nur-EFA ist auf allen EFA-kompatiblen Instances in allen AWS-Regionen verfügbar, einschließlich der Regionen AWS GovCloud (USA) und AWS China. Sie können EFA ohne zusätzliche Kosten aktivieren, um Ihre KI/ML-Workloads in großem Umfang auszuführen. Weitere Informationen finden Sie in der EFA-Dokumentation.