Fonctionnalités d'Amazon SageMaker Canvas

Créez des modèles de ML très précis à l'aide d'une interface visuelle, sans code

Développement de machine learning basé sur le chat avec Amazon Q Developer

Amazon Q Developer aide à combler le fossé entre les défis métier et les modèles de machine learning. Il traduit de manière experte les problèmes métier en flux de travail ML étape par étape et explique les termes du ML en utilisant un langage non technique.

Amazon Q Developer guide les utilisateurs de manière experte à chaque étape du développement de modèle, de la préparation des données à la création, à la formation et au déploiement de modèles de machine learning. À l’aide d’une interface de discussion, Amazon Q Developer fournit une assistance contextuelle et aide les utilisateurs à naviguer dans le flux de travail ML de bout en bout afin de créer des modèles de ML prêts pour la production.

Le générateur de pipeline déterministe d’Amazon Q Developer et les techniques d’AutoML avancées favorisent la reproductibilité et la précision au niveau de la création de modèles. En dotant les utilisateurs de fonctionnalités avancées de science des données, Q Developer permet une expérimentation rapide tout en préservant la confiance dans l’utilité des modèles.

Amazon Q Developer gère des artefacts tels que des jeux de données originaux et transformés, ainsi que les pipelines de préparation des données créés à l’aide du langage naturel. En outre, les modèles créés à l’aide de Q Developer peuvent être enregistrés dans SageMaker Model Registry, tandis que les modèles de blocs-notes peuvent être exportés pour une personnalisation et une intégration plus poussées.

Préparation des données

SageMaker Canvas se connecte à plus de 50 sources de données, mais vous pouvez également charger des fichiers locaux pour entraîner votre modèle ML. Les données sous forme de tableau, d'image ou de texte sont prises en charge. Vous pouvez également écrire des requêtes pour accéder aux sources de données à l'aide de SQL et importer des données directement dans divers formats de fichiers, tels que CSV, Parquet, ORC et JSON, et de tables de bases de données.
Grâce à l'interface sans code de SageMaker Canvas, vous pouvez explorer, visualiser et analyser des données à l'aide de visualisations intégrées ou personnalisées. En un seul clic, vous pouvez générer le rapport Data Quality and Insight pour vérifier la qualité des données, notamment en vous assurant que le jeu de données ne contient aucune valeur manquante ou ligne dupliquée, et également détecter des anomalies telles que les valeurs aberrantes, le déséquilibre des classes et les fuites de données.
SageMaker Canvas propose une sélection de plus de 300 transformations de données prédéfinies basées sur PySpark, afin que vous puissiez transformer vos données sans écrire une seule ligne de code. Vous pouvez également utiliser l'interface de chat basée sur le modèle de fondation pour préparer vos données.
SageMaker Canvas facilite le lancement ou la planification d'un flux de travail de préparation des données afin de traiter rapidement vos données et de mettre à l'échelle la préparation des données à des jeux de données, de les exporter vers un bloc-notes SageMaker Studio ou de les intégrer à SageMaker Pipelines.

Accès à des modèles ML et création des modèles

Grâce à l'interface sans code de SageMaker Canvas, vous pouvez créer automatiquement des modèles ML personnalisés à l'aide des données de votre entreprise. Une fois que vous avez sélectionné et préparé vos données et identifié ce que vous souhaitez prévoir, SageMaker Canvas identifie le type de problème, teste des centaines de modèles ML en fonction du type de problème (à l'aide de techniques de ML telles que la régression linéaire, la régression logistique, le deep learning, les prévisions de séries chronologiques et l'amplification des gradients) et crée un modèle personnalisé qui établit les prévisions les plus précises en fonction de votre jeu de données. Vous pouvez également importer votre propre modèle précédemment créé dans SageMaker Canvas et déployer le modèle à des fins d'inférence.

SageMaker Canvas donne accès à des modèles tabulaires, NLP et CV prêts à l'emploi pour des cas d'utilisation tels que l'analyse des sentiments, la détection d'objets dans les images, la détection de texte dans les images et l'extraction d'entités. Les modèles prêts à l'emploi ne nécessitent pas la création d'un modèle et sont alimentés par les services d'IA AWS, notamment Amazon Rekognition, Amazon Textract et Amazon Comprehend.

Après avoir créé votre modèle, vous pouvez évaluer ses performances avant de le déployer en production à l'aide des données de l'entreprise. Vous pouvez facilement comparer les réponses des modèles et sélectionner la réponse la mieux adaptée à vos besoins.

SageMaker Canvas donne accès à un modèle de fondation (FM) prêt à l'emploi pour la génération de contenu, l'extraction de texte et la synthèse de texte. Vous pouvez accéder à des modèles de fondation (FM) prêts à l’emploi tels que Claude 2, Llama-2, Amazon Titan, Jurassic-2 et Command (à technologie Amazon Bedrock) ainsi qu’à des FM accessibles au public tels que Falcon, Flan-T5, Mistral, Dolly et MPT (à technologie SageMaker JumpStart) et les régler à l’aide de vos propres données.

Génération des prédictions de ML

SageMaker Canvas propose une analyse visuelle des scénarios qui vous permet de modifier les entrées du modèle, puis de comprendre l'impact de ces modifications sur les prédictions individuelles. Vous pouvez créer des prédictions par lots automatisées pour un jeu de données complet. Ensuite, lorsque le jeu de données est mis à jour, votre modèle ML est automatiquement mis à jour. Une fois le modèle ML mis à jour, vous pouvez consulter les prévisions mises à jour à partir de l'interface sans code de SageMaker Canvas.

Vous pouvez déployer votre modèle SageMaker Canvas sur les points de terminaison SageMaker à des fins d'inférence en temps réel.

Partagez les prévisions des modèles avec Amazon QuickSight pour créer des tableaux de bord combinant l'informatique décisionnelle traditionnelle et les données prédictives dans un même visuel interactif. En outre, les modèles SageMaker Canvas peuvent être partagés et intégrés directement dans QuickSight, ce qui permet aux analystes de générer des prévisions très précises pour les nouvelles données dans un tableau de bord QuickSight.

Exploitation des MLOps

Vous pouvez enregistrer les modèles ML créés dans SageMaker Canvas dans le registre des modèles SageMaker en un seul clic afin d'intégrer le modèle dans les processus CI/CD de déploiement de modèles existants.

Vous pouvez partager vos modèles SageMaker Canvas avec les scientifiques des données qui utilisent SageMaker Studio. Les scientifiques des données peuvent ensuite examiner, mettre à jour et partager les modèles mis à jour avec vous ou déployer votre modèle à des fins d'inférence.