La technologie de découpage temporel des GPU NVIDIA est désormais disponible pour Bottlerocket afin d'améliorer l'efficacité de la charge de travail IA/ML
AWS a annoncé aujourd'hui l'introduction de la prise en charge du découpage temporel des GPU NVIDIA pour Bottlerocket, le système d'exploitation basé sur Linux spécialement conçu pour l'hébergement de conteneurs, en mettant l'accent sur la sécurité, une empreinte minime et des mises à jour sécurisées. Cette nouvelle fonctionnalité répond au défi d'optimiser l'utilisation des GPU dans les environnements à locataires multiples et aux ressources limitées en permettant un partage plus efficace des ressources GPU pour les charges de travail d'intelligence artificielle/machine learning (IA/ML) exécutées sur des conteneurs.
En divisant le temps de traitement du GPU en intervalles plus petits ou « tranches », la prise en charge du découpage temporel par Bottlerocket permet à plusieurs tâches d'accéder simultanément à un seul GPU. Cela permet aux clients de Bottlerocket d'exécuter plusieurs modèles IA/ML sur un seul GPU, améliorant ainsi l'utilisation du GPU et leur permettant de mettre à l’échelle leurs charges de travail de manière plus efficace.
La fonctionnalité de découpage temporal des GPU sur Bottlerocket est désormais proposée dans toutes les régions commerciales et AWS GovCloud (US). Pour en savoir plus sur la fonctionnalité de découpage temporel des GPU sur Bottlerocket, veuillez visiter le site Web du développeur de Bottlerocket.