Publié le: Jul 25, 2023

Amazon SageMaker Canvas prend désormais en charge cinq nouvelles transformations de données, ce qui vous permet de mieux préparer et analyser vos données avant de créer des modèles de machine learning (ML). Les données sont la base du machine learning et la transformation des données brutes pour les adapter à la création de modèles de ML ainsi qu’à la génération de prévisions est essentielle pour obtenir de meilleures informations. À compter d'aujourd'hui, SageMaker Canvas vous permet de modifier le type de données de vos colonnes (numérique, texte et date/heure), tout en affichant la fonctionnalité associée à ce type de données, telle que binaire et catégorielle. Cela vous donne la possibilité de modifier manuellement le type de données dans vos colonnes en fonction des caractéristiques. La possibilité de choisir le type de données approprié garantit l'intégrité et la précision des données avant de créer des modèles de machine learning. À titre d'exemple, l'utilisation d'un type de données datetime garantit que seules les dates valides sont stockées dans cette colonne particulière. 

En outre, Canvas vous permet de rééchantillonner des données de séries temporelles en établissant des intervalles réguliers pour les observations de votre jeu de données de séries temporelles. Cela est particulièrement utile lorsque les données de séries temporelles contiennent des observations espacées de manière irrégulière. Le rééchantillonnage de ces données vous aidera à les répartir de manière égale entre des intervalles de temps réguliers, ce qui les rend utiles pour les opérations en aval telles que les analyses et les prévisions. Enfin, Canvas propose désormais de meilleures méthodes de gestion des lignes de vos données en vous permettant de les trier par ordre croissant ou décroissant, de mélanger les lignes de manière aléatoire et de supprimer les lignes dupliquées.

Ces nouvelles fonctionnalités de transformation des données sont disponibles dans toutes les régions AWS où Canvas est actuellement pris en charge. Pour en savoir plus, consultez la documentation relative au produit.