Veröffentlicht am: Jun 28, 2022
Amazon SageMaker bietet eine Suite an integrierten Algorithmen, vortrainierten Modellen und vorgefertigten Lösungsvorlagen, mit denen Datenwissenschaftler und Machine Learning Practitioners schnell mit dem Trainieren und Bereitstellen von Machine-Learning-Modellen beginnen können. Diese Algorithmen und Modelle können sowohl für Supervised (überwachtes) als auch Unsupervised (unüberwachtes) Machine Learning verwendet werden. Sie können verschiedene Arten von Eingabedaten verarbeiten, darunter tabellarische Daten, Bild und Text.
Ab heute bietet Amazon SageMaker vier neue tabellarische Datenmodellierungsalgorithmen: LightGBM, CatBoost, AutoGluon-Tabular und TabTransformer. Diese beliebten, hochmodernen Algorithmen können sowohl für tabellarische Klassifizierungs- als auch Regressionsaufgaben verwendet werden. Sie sind über die SageMaker JumpStart UI in SageMaker Studio und bei Verwendung der SageMaker Python SDK über Pythoncode verfügbar. Informationen zur Verwendung dieser Algorithmen findest du in den folgenden SageMaker-Beispielnotebooks:
- LightGBM ist eine beliebte und leistungsstarke Open-Source-Implementierung des Gradient Boosting Decision Tree (Gradient-Boosting-Entscheidungsbaum, GBDT). Die Beispielnotebooks für Klassifizierung und Regression erläutern, wie dieser Algorithmus verwendet wird.
- CatBoost ist eine weitere beliebte und leistungsstarke Open-Source-Implementierung des Gradient Boosting Decision Tree (Gradient-Boosting-Entscheidungsbaum, GBDT). Die Beispielnotebooks für Klassifizierung und Regression erläutern, wie dieser Algorithmus verwendet wird.
- AutoGluon-Tabular ist ein Open-Source-AutoML-Projekt, das von Amazon entwickelt wurde und gepflegt wird. Es führt erweiterte Datenverarbeitung, Deep Learning und mehrschichtiges Stack-Ensembling durch. Die Beispielnotebooks für Klassifizierung und Regression erläutern, wie dieser Algorithmus verwendet wird.
- TabTransformer ist eine neuartige tiefe tabellarische Datenmodellierungsarchitektur, die auf Transformers, die auf Self-Attention basieren, aufgebaut wird. Das ist eine Innovation der Wissenschaftsforschung von Amazon. Die Beispielnotebooks für Klassifizierung und Regression erläutern, wie dieser Algorithmus verwendet wird.
Genauere Erläuterungen zur Verwendung dieser Algorithmen stehen in den folgenden Blogs mit den Titeln Bringing the power of deep learning to data in tables und New built-in Amazon SageMaker algorithms for tabular data modeling: LightGBM, CatBoost, AutoGluon-Tabular, and TabTransformer.
Diese vier Algorithmen können in allen Regionen verwendet werden, in denen Amazon SageMaker verfügbar ist. Um mit diesen neuen Modellen auf SageMaker zu beginnen, lies dir die Dokumentation durch.