Veröffentlicht am: Jan 28, 2022
Amazon SageMaker Autopilot erstellt, trainiert und optimiert automatisch die besten Modelle für Machine Learning basierend auf Ihren Daten und ermöglicht Ihnen gleichzeitig die vollständige Kontrolle und Sichtbarkeit. Sie können jetzt SageMaker Autopilot verwenden, um Machine-Learning-Modelle für Regressions- und Klassifizierungsprobleme bei Datensätzen zu erstellen, die größer als 10 GB sind, die zuvor unterstützte Grenze. Ab heute unterstützt SageMaker Autopilot Datensätze mit einer Größe von bis zu 100 GB standardmäßig in allen AWS-Regionen, in denen SageMaker Autopilot derzeit unterstützt wird. SageMaker Autopilot nimmt automatisch ein Subsample Ihres Datensatzes vor, wobei ein Klassenungleichgewicht berücksichtigt und seltene Klassenbezeichnungen beibehalten werden. Das standardmäßige Service-Limit von 100 GB kann erhöht werden, um Datensätze zu unterstützen, die größer als 100 GB sind, indem ein Antrag auf Limit-Erhöhung in der AWS-Support-Center-Konsole gestellt wird.
Sie können mit der automatischen Erstellung von Machine-Learning-Modellen mit Datensätzen bis zu 100 GB beginnen, indem Sie einfach wie gewohnt SageMaker Autopilot auf den Datensatz in Ihrem S3-Bucket richten. Autopilot analysiert diese Daten automatisch, erkennt ein Ungleichgewicht zwischen den Klassen und reduziert die Stichprobe, wobei die Beobachtungen der Minderheitsklasse bei binären Klassifizierungsproblemen beibehalten werden. Weitere Einzelheiten finden Sie unter Amazon-SageMaker-Autopilot-Kontingente. Einen tieferen Einblick erhalten Sie in unserem Blogbeitrag und in unseremBeispiel-Notizbuch, das eine Vorschau auf diese neue Funktion enthält. Informationen zu den ersten Schritten mit SageMaker Autopilot finden Sie auf der Produktseite oder greifen Sie in SageMaker Studio auf SageMaker Autopilot zu.