Publié le: Jan 28, 2022
Amazon SageMaker Autopilot crée, entraîne et ajuste automatiquement les meilleurs modèles de machine learning en fonction de vos données, tout en vous permettant de conserver le contrôle et de bénéficier d'une visibilité totale. Vous pouvez désormais utiliser SageMaker Autopilot afin de créer des modèles de machine learning pour les problèmes de régression et de classification sur des jeux de données supérieurs à 10 Go, la limite précédemment prise en charge. À compter d'aujourd'hui, SageMaker Autopilot prend en charge par défaut les jeux de données d'une taille maximale de 100 Go dans toutes les régions AWS dans lesquelles SageMaker Autopilot est actuellement pris en charge. SageMaker Autopilot sous-échantillonnera automatiquement votre jeu de données, tout en tenant compte du déséquilibre de classe et en préservant les labels de classe rares. La limite de service par défaut de 100 Go peut être augmentée afin de prendre en charge des jeux de données supérieurs à 100 Go en déposant une demande d'augmentation de limite dans la console AWS Support Center.
Vous pouvez commencer à créer automatiquement des modèles de machine learning avec des jeux de données allant jusqu'à 100 Go en dirigeant simplement SageMaker Autopilot sur le jeu de données dans votre compartiment S3. Autopilot analysera automatiquement ces données, détectera le déséquilibre de classe et sous-échantillonnera les observations, tout en conservant celles de la classe minoritaire dans les problèmes de classification binaire. Pour plus de détails, consultez les quotas Amazon SageMaker Autopilot. Afin d'obtenir davantage de détails, veuillez consulter notre article de blog ainsi que notre exemple de bloc-notes présentant ces nouvelles fonctions. Afin de commencer l'utilisation de SageMaker Autopilot, consultez la page produit ou accédez à Autopilot dans SageMaker Studio.