Publié le: Nov 29, 2023

Nous avons aujourd'hui le plaisir de vous annoncer la version préliminaire d'une nouvelle fonctionnalité de tamisage intelligent d'Amazon SageMaker. Son rôle consiste à inspecter et à évaluer automatiquement et à la volée les données d'apprentissage afin de ne tirer des enseignements que des échantillons de données les plus informatifs. Le délai d'entraînement des modèles et les dépenses associées s'en trouvent réduits (jusqu'à 35 % de baisse). Vous pouvez en quelques minutes commencer à utiliser le tamisage intelligent des données sans modifier vos pipelines de données ni vos scripts d'apprentissage.

Le tamisage intelligent utilise le modèle réel pendant l'entraînement pour analyser les échantillons de données entrants. Ensuite, il élimine automatiquement ceux qui représentent une faible perte et n'amélioreront pas le processus d'apprentissage du modèle. En sélectionnant uniquement les échantillons de données les plus informatifs, le tamisage intelligent permet de réduire le temps et les dépenses consacrés à l'entraînement de modèles de deep learning. Les clients qui se servent de PyTorch pour effectuer l'apprentissage de modèles de ce type sur des instances GPU accélérées dans SageMaker peuvent faire baisser de 35 % la durée de l'entraînement. Étant donné que les échantillons exclus représentent des pertes relativement faibles, l'impact sur la précision du modèle entraîné reste minime, voire nul. Pour commencer à utiliser le tamisage intelligent, consultez notre documentation associée.