Veröffentlicht am: Oct 23, 2023
Amazon SageMaker Feature Store unterstützt die Möglichkeit, benutzerdefinierte Datenquellen in Pipelines zur Feature-Verarbeitung zu integrieren. Sie können umfangreichere und vielfältigere ML-Features erstellen, indem Sie verschiedene Datenquellen einbinden und die auszuführenden Transformationsfunktionen definieren. Der SageMaker Feature Store kümmert sich dann um die Verarbeitung der Daten zu ML-Features.
Mit dieser Einführung können Sie eine Verbindung zu Streaming-Datenquellen wie Amazon Kinesis herstellen und Transformationen mit Spark Structured Streaming erstellen, einer skalierbaren und fehlertoleranten Stream-Processing-Engine für die Datenverarbeitung in Echtzeit. Sie können außerdem eine Verbindung zu Data Warehouses wie Amazon Redshift, Snowflake und Databricks für die Batch-Verarbeitung von Features herstellen und die Verarbeitung von Features nach einem Zeitplan oder mit einem Auslöser unter Verwendung von Amazon-EventBridge-Regeln starten. Amazon SageMaker Feature Store erstellt und verwaltet die Pipelines und schreibt in Ihre Feature-Gruppen für die Verwendung bei der Bereitstellung und Schulung von ML-Modellen. Sie können Ihre Pipeline-Ausführungen verfolgen, die Herkunft visualisieren, um Funktionen bis zu den Datenquellen zurückzuverfolgen, und Feature-Verarbeitungscode anzeigen – alles in einer Umgebung in Amazon SageMaker Studio.
Weitere Informationen finden Sie in der Dokumentation hier. Rufen Sie zum Einstieg zunächst SageMaker Studio über die Amazon-SageMaker-Konsole auf.