Publié le: Jun 28, 2022
Amazon SageMaker propose une suite d'algorithmes intégrés, de modèles pré-entraînés et de modèles de solutions préconçues pour aider les scientifiques des données et les professionnels du machine learning à lancer rapidement l'entraînement et le déploiement de modèles de ML. Ces algorithmes et modèles peuvent servir aussi bien pour l'apprentissage supervisé que l'apprentissage non supervisé. Ils peuvent traiter divers types de données d'entrée, notamment des données tabulaires, des images et du texte.
À compter d'aujourd'hui, Amazon SageMaker va proposer quatre nouveaux algorithmes de modélisation de données tabulaires : LightGBM, CatBoost, AutoGluon-Tabular et TabTransformer. Ces algorithmes populaires de pointe peuvent servir aussi bien pour la classification tabulaire que pour les tâches de régression. Ils sont disponibles via l'UI JumpStart de SageMaker dans SageMaker Studio, ainsi que via le code Python avec le kit SDK Python de SageMaker. Pour apprendre comment utiliser ces algorithmes, retrouvez les exemples de notebooks SageMaker ci-dessous :
- LightGBM est implémentation populaire hautes performances et open source du Gradient Boosting Decision Tree (GBDT). Pour apprendre à utiliser cet algorithme, consultez des notebooks d'exemple pour la classification et la régression.
- CatBoost est une autre implémentation populaire hautes performances et open source du Gradient Boosting Decision Tree (GBDT). Pour apprendre à utiliser cet algorithme, consultez des notebooks d'exemple pour la classification et la régression.
- AutoGluon-Tabular est un projet AutoML open source développé et entretenu par Amazon et qui réalise du traitement avancé de données, du deep learning ainsi que de l'assemblage de pile sur plusieurs couches. Pour apprendre à utiliser cet algorithme, consultez des notebooks d'exemple pour la classification et la régression.
- TabTransformer est une architecture de modélisation approfondie et récente de données tabulaires conçue sur l'autonomie à partir de Transformers, une innovation des laboratoires de recherche d'Amazon. Pour apprendre à utiliser cet algorithme, consultez des notebooks d'exemple pour la classification et la régression.
Vous trouverez davantage d'explications détaillées sur l'utilisation de ces algorithmes dans les blogs Bringing the power of deep learning to data in tables et New built-in Amazon SageMaker algorithms for tabular data modeling: LightGBM, CatBoost, AutoGluon-Tabular, and TabTransformer.
Ces quatre algorithmes peuvent être utilisés dans toutes les régions où Amazon SageMaker est disponible. Pour démarrer avec ces nouveaux modèles sur SageMaker, référez-vous à la documentation.