Publié le: Dec 3, 2019
Amazon SageMaker Autopilot est désormais disponible. Avec cette fonction, Amazon SageMaker peut utiliser vos données tabulaires et la colonne cible que vous avez spécifiée pour former et ajuster automatiquement votre modèle, tout en vous fournissant une visibilité totale sur le processus. Comme son nom le suggère, vous pouvez utiliser cette fonction avec le pilotage automatique pour déployer le modèle avec la plus grande des précisions en un seul clic dans Amazon SageMaker Studio, ou bien vous pouvez l’utiliser comme guide à la prise de décision et vous permettre de faire des compromis, comme la précision liée à la latence ou à la taille du modèle.
Il est bien souvent difficile de déterminer quel algorithme ML sera le mieux adapté à un certain ensemble de données, sans même parler de la difficulté à trouver les bons paramètres algorithmiques. De plus, vous devez nettoyer ou prétraiter les données afin de créer de bons modèles ML. Cela demande beaucoup de temps, et nécessite parfois d’avoir des compétences avancées en machine learning. Ces problèmes font que les équipes prennent des raccourcis ou des solutions alternatives, comme utiliser un ensemble de données en l’état plutôt que de nettoyer ou prétraiter les données. Les équipes finissent alors par se servir de l’algorithme facile à utiliser plutôt que de se servir du bon algorithme pour le problème en question. Par conséquent, les entreprises ont des difficultés à trouver la qualité du modèle qu’elles désirent. En outre, les spécialistes des données qui ont des connaissances ML complètes passent beaucoup de temps à tester différents modèles ML avant de trouver le meilleur modèle pour le problème en question, en particulier pour les applications comme les annonces publicitaires ou l’IoT qui ont des contraintes de taille et de latence.
Amazon SageMaker Autopilot simplifie l’ensemble du processus en rendant le machine learning plus simple, plus rapide et plus transparent. Vous pouvez désormais créer des modèles de classification et de régression sans connaissances approfondies du machine learning : il suffit de fournir un ensemble de données tabulaire et de sélectionner la colonne cible pour faire une prédiction, et SageMaker Autopilot explore automatiquement les solutions de machine learning avec des combinaisons différentes de préprocesseurs de données, d’algorithmes et de paramètres d’algorithme afin de trouver le modèle le plus précis. Au lieu de vous demander quel algorithme il faut utiliser, SageMaker Autopilot choisit automatiquement le bon algorithme parmi une liste d’algorithmes très performants. SageMaker Autopilot prend en charge de manière native et évalue tous les algorithmes. De plus, SageMaker Autopilot essaie automatiquement différents paramètres sur ces algorithmes afin d’obtenir le meilleur modèle de qualité. Vous pouvez désormais directement déployer le meilleur modèle en production en un seul clic, ou bien évaluer plusieurs options pour trouver un compromis entre les différentes métriques (précision, latence et taille du modèle, par exemple). Vous n’avez pas besoin de vous soucier du nettoyage ni du prétraitement des données, puisque SageMaker Autopilot applique automatiquement les différents types de préprocesseurs de données sur les données avant de les faire passer par les algorithmes pour former les modèles.
Amazon SageMaker est disponible dans les régions AWS suivantes : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Californie du Nord), USA Ouest (Oregon), Asie-Pacifique (Mumbai), Asie-Pacifique (Séoul), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo), Canada (Centre), UE (Francfort), UE (Irlande), UE (Londres), UE (Paris), et UE (Stockholm). Consultez la page de documentation pour en savoir plus sur SageMaker Autopilot et lisez notre article de blog pour apprendre à utiliser SageMaker Autopilot avec vos tâches de création de modèle.