Veröffentlicht am: May 28, 2021
Amazon SageMaker Autopilot erstellt, trainiert und optimiert automatisch die besten Modelle für Machine Learning basierend auf Ihren Daten und ermöglicht Ihnen gleichzeitig die vollständige Kontrolle und Sichtbarkeit. Ab heute führt Autopilot eine Kreuzvalidierung bei Eingabedatensätzen unter 50 000 Zeilen für alle Problemtypen durch – Regression, binäre Klassifikation und Mehrklassen-Klassifikation. Mit der Kreuzvalidierung profitieren Sie von einer erhöhten Robustheit gegenüber unerwünschten Teilungen zwischen Trainings- und Validierungsdaten, was zu einer verbesserten Modellqualität führt. Je nach Datensatz und Problemtyp können Sie eine um bis zu 35 % verbesserte Modellqualität feststellen.
Autopilot teilt Ihre Eingabedaten automatisch in Trainings- und Validierungssätze auf. Mit dieser Version verwendet Autopilot auch die Methode der k-fachen Kreuzvalidierung und führt die Inferenz mit dem Ensemble der Kreuzvalidierungsmodelle aus dem Test mit der besten Validierungsmetrik durch. Autopilot stellt sicher, dass jede Trainings- und Validierungsteilmenge eine gleichmäßige Repräsentation jeder Klasse aufweist, um die Präzision zu verbessern und das beste Modell mit den verfügbaren Daten zu erstellen. Sie können die endgültige Validierungsmetrik für jedes Modell in der Ausgabe Ihres Autopilot-Experiments anzeigen, bevor Sie sich für die Bereitstellung des Modells entscheiden. Darüber hinaus sind die detaillierten Aktualisierungen der Kreuzvalidierung einschließlich der Trainings- und Validierungsmetriken aus jeder Teilmenge in Amazon CloudWatch verfügbar.
Die automatische Kreuzvalidierung ist jetzt in allen AWS-Regionen verfügbar, in denen SageMaker Autopilot derzeit unterstützt wird. Lesen Sie zum Einstieg unsere Dokumentation oder rufen Sie Amazon SageMaker Studio auf, um ein neues Autopilot-Experiment zu erstellen.