Publié le: Oct 21, 2022
Aujourd'hui, nous sommes heureux d'annoncer la prise en charge de la planification des tâches de traitement Data Wrangler dans Amazon SageMaker Data Wrangler. Amazon SageMaker Data Wrangler réduit le temps nécessaire à l'agrégation et à la préparation des données pour le machine learning (ML) de plusieurs semaines à quelques minutes. SageMaker Data Wrangler vous permet également de simplifier le processus de préparation des données et d’ingénierie des fonctionnalités, mais aussi d’effectuer toutes les étapes du flux de travail de préparation de données telles que la sélection, le nettoyage, l’exploration et la visualisation des données depuis une seule interface visuelle. Auparavant, planifier une tâche de traitement de données nécessitait l'intégration d'une capacité de calcul sans serveur et d'un service de bus d'événements. Ce processus impliquait également la rédaction de code pour planifier les tâches de traitement de données dans un environnement de production. L'intégration de ces diverses capacités et la rédaction de code pour orchestrer ce flux de travail peuvent constituer des tâches laborieuses et chronophages pour les experts en science des données, les ingénieurs de données ainsi que les ingénieurs en machine learning.
Avec la prise en charge de la planification dans Data Wrangler, vous pouvez désormais programmer une tâche de traitement Data Wrangler en quelques clics. Les tâches peuvent être programmées pour s'exécuter à des heures et des jours spécifiques de la semaine. Des programmes peuvent également être saisis sous forme d'expressions CRON pour plus de personnalisation et de flexibilité (par exemple, pour planifier l'exécution d'une tâche tous les premiers mercredi du mois). Vous pouvez associer jusqu'à deux programmes à une tâche de traitement Data Wrangler. Une fois qu'un programme est entré, Data Wrangler affiche un aperçu des cinq prochaines tâches pour confirmation. Cette fonctionnalité de planification est accessible dans le flux de travail « Create Job » (Créer une tâche) de Data Wrangler.
Cette fonctionnalité est généralement disponible dans toutes les régions AWS actuellement prises en charge par Data Wrangler sans coût supplémentaire. Pour commencer à planifier vos tâches de traitement de données avec SageMaker Data Wrangler, lisez la documentation AWS.