Publié le: Oct 23, 2023
Amazon SageMaker Feature Store permet d'intégrer des sources de données personnalisées dans les pipelines de fonctionnalisation. Vous pouvez créer des fonctionnalités de ML plus riches et plus variées en incorporant diverses sources de données, en définissant les fonctions de transformation à exécuter, et SageMaker Feature Store se charge du traitement des données en fonctionnalités de ML.
Avec ce lancement, vous pouvez vous connecter à des sources de données de streaming telles qu'Amazon Kinesis et créer des transformations grâce à Spark Structured Streaming, un moteur de traitement de flux évolutif et tolérant aux pannes pour le traitement des données en temps réel. Vous pouvez également vous connecter à des entrepôts de données tels qu'Amazon Redshift, Snowflake et Databricks pour le traitement par lots des fonctionnalités, et lancer la fonctionnalisation selon un calendrier ou à l'aide d'un déclencheur en utilisant les règles Amazon EventBridge. Amazon SageMaker Feature Store crée et gère les pipelines et écrit dans vos groupes de fonctionnalités pour les utiliser dans le cadre de la diffusion et de la formation de modèles ML. Vous pouvez suivre les exécutions de votre pipeline, visualiser le lignage pour retracer les entités jusqu'aux sources de données et consulter le code de fonctionnalisation, le tout dans un environnement unique dans Amazon SageMaker Studio.
Pour en savoir plus, consultez la documentation ici. Pour commencer, accédez à SageMaker Studio depuis la console Amazon SageMaker.