Publié le: May 10, 2023

Amazon SageMaker Autopilot, un service de machine learning (ML) low-code qui crée, entraîne et ajuste automatiquement les meilleurs modèles de machine learning, prend désormais en charge l'entraînement avec des mesures objectives pondérées en mode Ensemble et prend également en charge huit mesures d'objectifs supplémentaires. L'attribution de poids à chaque échantillon de données de l'ensemble de données d'entraînement peut améliorer les performances globales du modèle en l'aidant à mieux apprendre, en réduisant les biais en faveur d'une classe particulière et en augmentant la stabilité. 

Lorsque vous vous entraînez sur des ensembles de données déséquilibrés dans lesquels certaines classes contiennent beaucoup moins d'échantillons de données que d'autres, l'attribution de poids plus élevés à ces ensembles peut aider le modèle à mieux apprendre et à réduire les biais en faveur des classes majoritaires. À compter d'aujourd'hui, vous pouvez transmettre un nom de colonne de pondération dans votre jeu de données d'entrée lors de la création d'une expérience Autopilot. SageMaker Autopilot utilisera ces valeurs de pondération pour en savoir plus sur votre jeu de données et appliquer les leçons apprises lors de l'entraînement du modèle ML. 

SageMaker Autopilot prend désormais également en charge huit indicateurs objectifs supplémentaires tels que RMSE, MAE, R2, Balanced Accuracy, Precision, Precision Macro, Recall et Recall Macro (documentés ici). La métrique objective sélectionnée est optimisée pendant l'apprentissage afin de fournir la meilleure estimation des valeurs des paramètres du modèle à partir des données. Si vous ne spécifiez pas de métrique de manière explicite, le comportement par défaut consiste à utiliser automatiquement MSE pour la régression, F1 pour la classification binaire et Accuracy pour la classification multiclasse.

Pour commencer, créez une expérience SageMaker Autopilot dans la console SageMaker Studio. Passez à la dernière version de SageMaker Studio pour utiliser la nouvelle fonctionnalité de colonne des poids d'échantillon et un ensemble supplémentaire de mesures objectives. Pour en savoir plus, consultez le guide du développeur et la page produit.