Publié le: Nov 7, 2022

Amazon SageMaker Canvas prend en charge les matrices de corrélation pour l'analyse avancée des données, élargissant ainsi les possibilités d'obtenir des insights de vos données avant de créer des modèles de ML. SageMaker Canvas est une interface visuelle de type pointer-cliquer qui permet aux analystes métier de générer seuls des prédictions de ML précises, sans nécessiter une expérience dans le machine learning (ML) ou écrire la moindre ligne de code.  

SageMaker Canvas offre des fonctionnalités d'analyse et d'exploration de vos données telles que la possibilité d'imputer les valeurs manquantes et les valeurs aberrantes avec des valeurs standard ou personnalisées, l'utilisation de fonctions et d'opérateurs mathématiques pour définir et créer de nouvelles fonctionnalités, et l'exploration visuelle des données via des diagrammes en boîte, des graphiques à barres et des diagrammes en nuages de points. À compter d'aujourd'hui, SageMaker Canvas prend en charge les matrices de corrélation, ce qui vous permet de résumer un jeu de données en une matrice montrant les corrélations entre deux ou plusieurs valeurs et la façon dont elles sont liées entre-elles. Cela vous aide à identifier et à visualiser les modèles dans un jeu de données donné pour une analyse avancée.

Vous pouvez maintenant générer des matrices de corrélation pour les variables numériques, catégorielles et une combinaison des deux. Les jeux de données peuvent être analysés en utilisant les corrélations de Pearson ou de Spearman pour les valeurs numériques, ou l'information mutuelle pour les valeurs catégorielles, ce qui vous donne plus de choix et de flexibilité. Le résultat de ces matrices peut être utilisé pour imputer les données manquantes, attribuer une pondération aux valeurs pour comprendre la variance, et d'autres analyses avancées. Les matrices de corrélation sont applicables à de nombreux cas d'utilisation tels que l'analyse de la variation des prix en fonction de l'offre et de la demande, la prévision de la quantité de pluie en fonction de schémas météorologiques, et la compréhension de la propension à acheter en fonction des nouvelles caractéristiques d'un produit ou d'un service.

L'analyse avancée des données à l'aide de matrices de corrélation est désormais disponible dans toutes les régions AWS où SageMaker Canvas est pris en charge. Pour en savoir plus sur SageMaker Canvas et vous lancer, consultez la page produit ainsi que la page des questions fréquentes (FAQ).