Publié le: Sep 29, 2022
Amazon SageMaker Canvas prend désormais en charge les fonctions mathématiques et les opérateurs pour une exploration enrichie des données, ce qui vous permet de définir de nouvelle caractéristiques dans vos données. SageMaker Canvas est un service visuel de type pointer-cliquer qui permet aux analystes métier de générer seuls des prédictions de ML précises, sans nécessiter une expérience dans le machine learning (ML) ou écrire la moindre ligne de code.
SageMaker Canvas prend en charge certaines transformations des données pour filtrer, regrouper et modifier les jeux de données, ainsi que des visualisations avancées pour comprendre les liens entre les variables dans vos données. À compter d'aujourd'hui, vous pouvez utiliser des fonctions mathématiques et des opérateurs logiques avec ces transformations des données pour mieux comprendre la répartition de vos données avant de créer des modèles de ML. Les résultats de ces fonctions et opérateurs vous permettront de créer de nouvelles caractéristiques que vous pourrez visualiser par rapport à des attributs spécifiques. Les fonctions mathématiques prises en charge incluent l'addition, la soustraction, la multiplication, la division, la moyenne, l'écart-type et les variations, mais aussi les fonctions exponentielle et logarithme. En outre, SageMaker Canvas prend en charge des opérateurs logiques comme les déclarations if-then-else pour définir des conditions spécifiques, ce qui vous permet de mieux comprendre, répartir et explorer vos données.
Grâce à ces nouvelles caractéristiques, SageMaker Canvas permet de recourir au binning, une technique de prétraitement des données. Le binning est une méthode de regroupement de valeurs numériques ou catégoriques connexes sous forme d'ensembles en plus petits nombres appelés des bins. Par exemple, si vous avez un jeu de données de suivi de mobilier, vous pouvez regrouper ces données selon différents bins comme le mobilier de bureau, le mobilier de salon ou le mobilier de chambre. Le binning permet d'identifier les aberrations ou les valeurs non valides, mais aussi de réduire les occurrences de non-linéarité dans les jeux de données pour ainsi améliorer la précision de vos modèles de ML.
La possibilité de définir et utiliser de nouvelles caractéristiques grâce aux fonctions mathématiques et opérateurs pour répartir les données dans des bins logiques est désormais disponible dans toutes les régions dans lesquelles SageMaker Canvas est disponible. Pour en savoir plus sur SageMaker Canvas et vous lancer, consultez la page produit ainsi que la documentation technique.