Publié le: Oct 6, 2021
Avec Amazon SageMaker Data Wrangler, regrouper et préparer des données pour le Machine Learning (ML) ne prend plus des semaines, mais seulement quelques minutes. SageMaker Data Wrangler vous permet également de simplifier le processus de préparation des données et d'ingénierie des fonctionnalités, mais aussi d'effectuer toutes les étapes du flux de travail de préparation de données, telles que la sélection, le nettoyage, l'exploration et la visualisation des données, depuis une seule interface visuelle.
À compter d'aujourd'hui, vous pouvez utiliser les nouvelles possibilités d'Amazon SageMaker Data Wrangler qui facilitent et accélèrent la préparation de données pour le Machine Learning. Elles incluent notamment une nouvelle collection de transformations de séries chronologiques et deux nouvelles visualisations de séries chronologiques pour générer rapidement des informations à partir de vos données en séries chronologiques. Les nouvelles transformations de séries chronologiques prennent en charge les imputations de valeurs manquantes, la caractérisation de séries chronologiques (ex., coefficients de Fourier, statistiques d'autocorrélation, entropie, etc.), les opérateurs de rééchantillonnage pour réduire ou augmenter la taille d'échantillonnage des jeux de données selon une fréquence uniforme, les caractéristiques de décalage temporel et les fonctions de fenêtre glissante. Les nouvelles transformations gèrent aussi des opérations plus générales, telles que le regroupement, l'unification de longueur, l'aplatissement et l'exportation de colonnes à valeur vectorielle.
En outre, vous pouvez désormais visualiser la saisonnalité et les tendances dans vos données et identifier les anomalies grâce aux nouvelles visualisations de séries chronologiques d’Amazon SageMaker Data Wrangler. La visualisation de la saisonnalité et des tendances vous permet ainsi de séparer effets saisonniers et tendances dans vos données de vente. Par ailleurs, grâce à la visualisation de la détection de valeurs aberrantes, vous pouvez identifier ces valeurs dans vos jeux de données sur les achats des clients afin de repérer des changements dans leur comportement d'achat.
Pour démarrer avec les nouvelles fonctionnalités d'Amazon SageMaker Data Wrangler, ouvrez Amazon SageMaker Studio après avoir effectué la mise à niveau vers la dernière version, puis cliquez sur Fichier > Nouveau> Flux dans le menu ou sur « Nouveau flux de données » dans le lanceur de SageMaker Studio. Pour en savoir plus sur les nouvelles transformations et visualisations de séries chronologiques, consultez la documentation.