Publié le: May 28, 2021
Amazon SageMaker Autopilot crée, entraîne et ajuste automatiquement les meilleurs modèles de machine learning en fonction de vos données, tout en vous permettant de conserver un contrôle et une visibilité totale. Dès aujourd’hui, Autopilot effectue des validations croisées sur les jeux de données d’entrée de moins de 50 000 lignes pour tous les types de problème : régression, classification binaire et classification multi-catégories. Grâce à la validation croisée, vous bénéficiez d’une robustesse améliorée aux divisions non-désirées entre les données d’entraînement et de validation, ce qui permet une qualité de modèle améliorée. Selon le jeu de données et le type de problèmes, vous pouvez voir une qualité de modèle améliorée jusqu’à 35 %.
Autopilot divise automatiques vos données d’entrée en des jeux d’entraînement et de validation. Avec ce lancement, Autopilot utilise également une méthode de validation croisée « K-fold » et effectue des inférences avec l’ensemble des modèles de validation croisée de l’essai avec la meilleure métrique de validation. Autopilot garantit que chaque pli d’entraînement et de validation a une représentation égale à chaque catégorie pour aider à améliorer la précision et créer le meilleur modèle avec les données disponibles. Vous pouvez visualiser la métrique de validation finale de chaque modèle dans la sortie de votre expérience Autopilot avant de choisir de déployer le modèle. De plus, les mises à jour détaillées de validation croisée, y compris les métriques d’entraînement et de validation pour chaque pli, sont disponibles sur Amazon CloudWatch.
La validation croisée automatique est disponible dans toutes les régions AWS où SageMaker Autopilot est actuellement pris en charge. Pour commencer, consultez notre documentation ou accéder à Amazon SageMaker Studio pour créer une nouvelle expérience Autopilot.