Amazon SageMaker Data Labeling

Créez des jeux de données de haute qualité pour l'entraînement de modèles de machine learning

Améliorer la qualité des jeux de données d'entraînement

Choisir votre main-d'œuvre d'étiquetage des données

Augmenter la visibilité des opérations d'étiquetage des données

Recevoir rapidement des données étiquetées de haute qualité

Grâce à Amazon SageMaker vous identifiez les données brutes, comme des images, des fichiers texte et des vidéos, ajoutez des étiquettes informatives et générez des données de synthèse étiquetées, afin de créer des jeux de données d'entraînement de haute qualité pour vos modèles d’apprentissage automatique (AA). SageMaker propose deux options, Amazon SageMaker Ground Truth Plus et Amazon SageMaker Ground Truth, qui vous donnent la possibilité de faire appel à une équipe d'experts pour créer et gérer les flux d'étiquetage des données pour vous ou de gérer vos propres flux d'étiquetage des données.

Amazon SageMaker Ground Truth Plus

Grâce à SageMaker Ground Truth Plus, vous pouvez créer des jeux de données d'entraînement de haute qualité sans avoir à créer des applications d'étiquetage ou à gérer des équipes d'étiquetage vous-même. Amazon SageMaker Ground Truth Plus réduit les coûts d'étiquetage des données jusqu'à 40 %. SageMaker Ground Truth Plus met à votre disposition des experts formés aux tâches de ML, qui peuvent vous aider à répondre à vos exigences de sécurité des données, de confidentialité et de conformité. Vous téléchargez vos données, puis SageMaker Ground Truth Plus crée et gère les flux et la main-d'œuvre d'étiquetage des données pour vous.

Amazon SageMaker Ground Truth

Si vous souhaitez créer et gérer vos propres flux et votre propre main-d'œuvre d'étiquetage des données, vous pouvez utiliser SageMaker Ground Truth. SageMaker Ground Truth est un service d'étiquetage de données qui facilite l'étiquetage des données et vous donne la possibilité d'utiliser une main-d'œuvre d'annotateurs par le biais d'Amazon Mechanical Turk, des fournisseurs tiers ou votre propre main-d'œuvre privée.

Vous pouvez également générer des données de synthèse étiquetées sans avoir à collecter ou étiqueter manuellement les données réelles. SageMaker Ground Truth peut générer pour vous des centaines de milliers d'images de synthèse étiquetées automatiquement.

Fonctionnement

  • Labelliser des données avec SageMaker Ground Truth Plus
  • Labelliser des données avec SageMaker Ground Truth
  • Générer des données de synthèse étiquetées
  • Comparaison des fonctions
  • Labelliser des données avec SageMaker Ground Truth Plus
  • Amazon SageMaker Ground Truth Plus vous aide à créer des jeux de données d'entraînement de haute qualité sans avoir à créer des applications de labellisation ou à gérer une main-d'œuvre de labellisation.

    Comment fonctionne Amazon SageMaker Ground Truth Plus
  • Labelliser des données avec SageMaker Ground Truth
  • Amazon SageMaker Ground Truth vous aide à créer et à gérer vos propres flux d'étiquetage de données et main-d'œuvre d'étiquetage de données.

    Comment fonctionne Amazon SageMaker Ground Truth
  • Générer des données de synthèse étiquetées
  • Amazon SageMaker Ground Truth vous aider à générer des données de synthèse étiquetées.

    Générer des données de synthèse étiquetées
  • Comparaison des fonctions
  • Catégorie Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus
    Flux d'étiquetage des données Flux personnalisés ou plus de 30 flux intégrés pour le texte, les images, la vidéo et les nuages de points 3D. Vous gérez vos flux d'étiquetage des données et la qualité de l'étiquetage des données Flux personnalisés ou plus de 30 flux intégrés pour le texte, les images, la vidéo et les nuages de points 3D. Vous gérez vos flux d'étiquetage des données et la qualité de l'étiquetage des données
    Utilisateur Scientifiques des données et ingénieurs en ML Scientifiques des données, Ingénieurs en ML, Responsables des opérations de données et Responsables de programme
    Main-d'œuvre Votre choix : fournisseurs tiers, Amazon Mechanical Turk ou votre propre main-d'œuvre privée Une équipe d'experts qui peut vous aider à répondre à vos exigences de sécurité des données, de confidentialité et de conformité 
    Techniques d'étiquetage ML  Apprentissage actif Apprentissage actif, pré-étiquetage et validation automatique 
    Génération de données de synthèse Pris(e) en charge Pris(e) en charge

Avantages

Améliorer la qualité des jeux de données d'entraînement

Les offres d'étiquetage des données Amazon SageMaker fournissent des techniques d'étiquetage ML qui sont moins sujettes aux erreurs manuelles, notamment la génération de données de synthèse, et contribuent à améliorer la qualité des jeux de données d'entraînement. Amazon SageMaker Ground Truth Plus dispose d'un flux d'étiquetage en plusieurs étapes qui comprend les modèles ML (pour le pré-étiquetage), la validation automatique de l'étiquetage humain (pour détecter les erreurs et les étiquettes de mauvaise qualité) et les fonctions d'assistance à l'étiquetage (par exemple instantanés cubiques 3D, prédiction du suivant dans l'étiquetage vidéo et outils de segmentation automatique). Si vous gérez vos propres flux d'étiquetage des données, SageMaker Ground Truth fournit des fonctions d'étiquetage automatisées telles que le segmentation automatique, les instantanés cubiques 3D automatiques et la fusion de capteurs avec des trames vidéo 2D. De plus, SageMaker Ground Truth fournit un étiquetage automatique des données qui utilise l'apprentissage actif et n'achemine les données étiquetées aux humains que si le modèle ne peut pas les étiqueter en toute confiance.

Choisir votre main-d'œuvre d'étiquetage des données

Avec les offres d'étiquetage des données d'Amazon SageMaker, vous disposez de deux options pour étiqueter les données. D'une part, avec SageMaker Ground Truth Plus, une main-d'œuvre experte formée aux tâches de ML étiquette vos données conformément à vos exigences en matière de qualité et de délai de traitement. D'autre part, avec SageMaker Ground Truth, vous pouvez créer et gérer vos flux d'étiquetage des données. Vous avez la possibilité de travailler avec des étiqueteurs à l'intérieur et à l'extérieur de votre organisation. Par exemple, vous pouvez envoyer des tâches d'étiquetage à vos propres étiqueteurs ou accéder à plus de 500 000 entrepreneurs indépendants qui effectuent déjà des tâches ML par le biais d'Amazon Mechanical Turk. Si la confidentialité de vos données doit être protégée ou si elles nécessitent des compétences particulières, vous pouvez également faire appel à des fournisseurs pré-sélectionnés par AWS pour leurs procédures de qualité et de sécurité. Si vous devez accéder à des données de synthèse pour que vos jeux de données d'entraînement soient plus complets pour entraîner des modèles ML, les artistes numériques AWS utilisent les ressources et les images fournies par le client pour générer des données de synthèse qui sont automatiquement étiquetées pour vous.

Augmenter la visibilité des opérations d'étiquetage des données

Les offres d'étiquetage des données Amazon SageMaker vous permettent d'obtenir une transparence dans les opérations d'étiquetage des données et la gestion de la qualité, afin que vous puissiez vérifier que vos exigences en matière de qualité sont respectées. SageMaker Ground Truth Plus fournit des tableaux de bord interactifs et des interfaces utilisateur. Ce processus vous permet donc d'examiner la progression des jeux de données d'entraînement sur plusieurs projets, de suivre les métriques du projet telles que le débit quotidien, d'inspecter les étiquètes pour en vérifier la qualité et de fournir des commentaires sur les données étiquetées.

Recevoir rapidement des données étiquetées de haute qualité

Avec les offres d'étiquetage des données Amazon SageMaker, vous pouvez recevoir rapidement des données étiquetées de haute qualité. Avec SageMaker Ground Truth Plus, vous chargez vos données dans Amazon S3 en respectant les exigences de sécurité, de confidentialité et de conformité. Les experts d'AWS configurent ensuite le flux d'étiquetage des données et une main-d'œuvre experte se charge de vos tâches d'étiquetage. Si vous devez accéder à des données de synthèse, vous spécifiez vos exigences en matière d'images ou fournissez des ressources 3D et des images de référence, et SageMaker Ground Truth peut générer des données de synthèse étiquetées très précises pour l'entraînement des modèles ML.

Tarification d'Amazon SageMaker Ground Truth
Des questions ?

Consultez la page des questions fréquentes (FAQ) sur Amazon SageMaker Data Labeling.

En savoir plus 
Créer un compte AWS
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Commencez à créer dans la console
Commencez à créer dans la console

Commencez à créer avec Amazon SageMaker Data Labeling dans la console de gestion AWS.

Se connecter