Amazon SageMaker pour les scientifiques des données

Environnement de développement intégré (IDE) dédié au cycle de vie du machine learning (ML)

250 heures par mois de ml.t3.medium

sur les blocs-notes Studio pendant les 2 premiers mois grâce à l'offre gratuite AWS

Accès aux données de sources de données structurées et non structurées

Amélioration de la productivité à l'aide d'outils sur mesure

Blocs-notes (notebooks) Jupyter entièrement gérés en quelques clics

Fonctionnement

La science des données est l'extraction de connaissances d'ensembles de données pour les entreprises. Elle pose des questions et y répond. Voici quelques exemples : « Que s'est-il passé ? », « Pourquoi cela s'est-il passé ? » et « Que se passera-t-il ensuite ? ». Le machine learning (ML) est essentiel pour la science des données, en ce sens qu'il permet aux machines de résoudre des problèmes que l'analytique traditionnelle ne peut pas résoudre facilement avec la logique basée sur les règles. Le ML analyse les données et détecte des modèles par le biais d'un apprentissage à partir d'exemples. Les machines peuvent ensuite utiliser ces modèles pour reconnaître des instances inconnues. Amazon SageMaker offre un large éventail de capacités ML utilisées par des dizaines de milliers de clients pour accéder à des données et les analyser, et créer, entraîner et déployer des modèles ML de haute qualité. Vos équipes de scientifiques des données peuvent être jusqu'à 10 fois plus productives grâce à Amazon SageMaker.

Amazon SageMaker pour les scientifiques des données

Préparation

Préparer des données pour le ML en quelques minutes

Grâce à l'outil de sélection de données de SageMaker Data Wrangler, vous pouvez sélectionner rapidement des données à partir de plusieurs sources de données, p. ex. Amazon Athena, Amazon Redshift, AWS Lake Formation, Simple Storage Service (S3) et l’Amazon SageMaker Feature Store. Vous pouvez écrire des requêtes pour les sources de données et importer des données directement dans SageMaker à partir de divers formats de fichiers, et utiliser les modèles de visualisation et les transformations de données intégrées de SageMaker Data Wrangler pour vous assurer que les données préparées produiront des modèles ML précis.

En savoir plus »
Préparer des données pour le ML en quelques minutes

Feature Store à faible latence

SageMaker Feature Store est un référentiel entièrement géré permettant de stocker, mettre à jour, récupérer et partager des caractéristiques de machine learning. Il fournit exactement les mêmes fonctions en lot pour l'entraînement et en temps réel pour l'inférence. Il n'est donc pas nécessaire d'écrire du code pour assurer la cohérence des fonctions. Vous pouvez facilement ajouter de nouvelles fonctions, mettre à jour les fonctions existantes, récupérer des fonctions en lots pour l'entraînement et obtenir les mêmes fonctions avec une latence de moins de 10 millisecondes pour l'inférence en temps réel.

En savoir plus »
Feature Store à faible latence

Préparation évolutive des données à l'aide de blocs-notes

Vous pouvez parcourir, découvrir et utiliser de façon visuelle les environnement de traitement des données Apache Spark qui s'exécutent sur Amazon EMR à partir de vos blocs-notes SageMaker Studio en quelques clics. Une fois connecté, vous pouvez interroger, explorer et visualiser de manière interactive les données, ainsi qu'exécuter les tâches Spark à l'aide du langage de votre choix (SQL, Python, Scala) pour créer des flux ML et de préparation des données de bout en bout.

En savoir plus »
Préparation évolutive des données à l'aide de blocs-notes

Étiquetage des données

L'étiquetage des données d'Amazon SageMaker vous permet d'identifier des données brutes, telles que des images, des fichiers texte et des vidéos, et d'ajouter des étiquettes informatives pour créer des jeux de données d'entraînement de haute qualité pour vos modèles de machine learning.

En savoir plus »
Étiquetage des données

Création

Blocs-notes Jupyter en un clic

Les blocs-notes Amazon SageMaker Studio sont des blocs-notes Jupyter à un clic qui peuvent être démarrés rapidement. Les ressources de calcul sous-jacentes sont entièrement élastiques, vous pouvez donc facilement composer les ressources disponibles ou les diminuer, et les modifications ont lieu automatiquement en arrière-plan sans interrompre votre travail. Les blocs-notes peuvent être partagés en un seul clic, et vos collègues obtiennent exactement le même bloc-notes, enregistré au même endroit.

En savoir plus »
Blocs-notes Jupyter en un clic

Algorithmes intégrés

Amazon SageMaker offre plus de 15 algorithmes intégrés, disponibles dans des images de conteneur pré-configurées qui peuvent être utilisées pour entraîner et exécuter rapidement des inférences.

Démarrer »
Algorithmes intégrés

Solutions pré-intégrées et modèles Open Source

Amazon SageMaker JumpStart vous aide à démarrer rapidement avec le ML en utilisant des solutions prédéfinies qui peuvent être déployées en quelques clics seulement. SageMaker JumpStart prend également en charge le déploiement et le réglage en un clic de plus de 150 modèles Open Source courants.

Démarrer »
Solutions pré-intégrées et modèles Open Source

Optimisé pour les principaux cadres

Amazon SageMaker est optimisé pour de nombreux cadres populaires de Deep Learning, tels que TensorFlow, Apache MXNet, PyTorch, etc. Les cadres sont toujours à jour grâce à la dernière version et sont optimisés pour fonctionner sur AWS. Vous ne devez pas configurer ces cadres manuellement et vous pouvez les utiliser dans les conteneurs intégrés.

Démarrer »
Optimisé pour les principaux cadres

Entraînement

Détecter les biais et comprendre les prédictions

Amazon SageMaker Clarify fournit des données pour améliorer la qualité des modèles par la détection de biais pendant la préparation des données et après l'entraînement. SageMaker Clarify fournit également des rapports d'explicabilité des modèles afin que les parties prenantes puissent voir comment et pourquoi les modèles font des prévisions.

En savoir plus »
Détecter les biais et comprendre les prédictions

Organiser, suivre et évaluer les exécutions d'entraînement

Amazon SageMaker Experiments capture automatiquement les paramètres d'entrée, les configurations et les résultats de l'entraînement, puis les stocke en tant qu’« expériences ». Vous pouvez parcourir les expériences actives, rechercher les expériences précédentes à l’aide de leurs caractéristiques, évaluer les expériences précédentes avec leurs résultats et établir des comparaisons visuelles entre les expériences.

En savoir plus »
Organiser, suivre et évaluer les exécutions d'entraînement

Détecter et déboguer les problèmes

Amazon SageMaker Debugger capture les métriques en temps réel afin que vous puissiez corriger rapidement les problèmes de performance avant que le modèle ne soit déployé en production.

En savoir plus »
Détecter et déboguer les problèmes

Déploiement

Suivre en continu les modèles

Amazon SageMaker Model Monitor détecte automatiquement les déviations de modèle et de concept et fournit des alertes détaillées qui aident à identifier la source du problème afin que vous puissiez améliorer la qualité du modèle au fil du temps. Tous les modèles entraînés dans SageMaker émettent automatiquement des métriques clés qui peuvent être collectées et visualisées dans SageMaker Studio.

En savoir plus »
Suivi continu des modèles

Options pour un déploiement facile

Amazon SageMaker propose le plus vaste éventail d'options de déploiement de modèle et d'infrastructure de machine learning (ML) pour répondre aux besoins de votre cas d'utilisation, que ce soit en temps réel ou par lot. Vous pouvez ainsi déployer aisément vos modèles ML à grande échelle. SageMaker prend en charge l'ensemble des exigences d'inférence, depuis la faible latence (quelques millisecondes) jusqu'à un débit élevé (des centaines de milliers de demandes d'inférence par seconde) en passant par les inférences de longue durée pour des cas d'utilisation tels que le traitement du langage naturel (NLP) et la reconnaissance d'image (CV).

En savoir plus »
Options pour un déploiement facile

Mise en route

En savoir plus sur Amazon SageMaker Studio

Consulter la page Web »

Apprendre le machine learning

Démarrer la création »

D'autres questions ?

Explorer les ressources »

Découvrir plus d'offres AWS