Amazon SageMaker Data Labeling

Créez des jeux de données de grande qualité pour l'entraînement de modèles de machine learning

Amazon SageMaker propose deux offres en matière d'étiquetage des données : Amazon SageMaker Ground Truth Plus et Amazon SageMaker Ground Truth. Les deux options vous permettent d'identifier des données brutes, telles que des images, des fichiers texte et des vidéos, et d'ajouter des étiquettes informatives pour créer des jeux de données d'entraînement de haute qualité pour vos modèles de machine learning.

Amazon SageMaker Ground Truth Plus

Avec Amazon SageMaker Ground Truth Plus, vous pouvez facilement créer des jeux de données d'entraînement de haute qualité sans avoir à créer des applications de labellisation ou à gérer la main-d'œuvre de labellisation par vous-même Amazon SageMaker Ground Truth Plus permet de réduire les coûts d’étiquetage des données jusqu’à 40 %. Amazon SageMaker Ground Truth Plus fournit une main-d'œuvre experte formée aux tâches de ML et peut vous aider à répondre à vos exigences en matière de sécurité, de confidentialité et de conformité des données. Vous chargez simplement vos données, et Amazon SageMaker Ground Truth Plus crée ensuite des flux d'étiquetage des données et gère les flux en votre nom.

Amazon SageMaker Ground Truth

Si vous souhaitez avoir la flexibilité de créer et de gérer vos flux d'étiquetage des données, ainsi que de gérer votre propre main-d'œuvre d'étiquetage des données, vous pouvez utiliser Amazon SageMaker Ground Truth. SageMaker Ground Truth est un service d'étiquetage de données qui facilite l'étiquetage des données et vous donne la possibilité d'utiliser des annotateurs humains via Amazon Mechanical Turk, des fournisseurs tiers ou votre propre main-d'œuvre privée.

Fonctionnement

  • Labelliser des données avec SageMaker Ground Truth Plus
  • Labelliser des données avec SageMaker Ground Truth
  • Comparaison des fonctionnalités
  • Labelliser des données avec SageMaker Ground Truth Plus
  • Amazon SageMaker Ground Truth Plus vous aide à créer des jeux de données d'entraînement de haute qualité sans avoir à créer des applications de labellisation ou à gérer une main-d'œuvre de labellisation.

    Comment fonctionne Amazon SageMaker Ground Truth Plus
  • Labelliser des données avec SageMaker Ground Truth
  • Amazon SageMaker Ground Truth vous aide à créer et à gérer vos propres flux d'étiquetage de données et main-d'œuvre d'étiquetage de données.

    Comment fonctionne Amazon SageMaker Ground Truth
  • Comparaison des fonctionnalités
  • Catégorie Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus
    Flux d'étiquetage des données Des flux personnalisés ou plus de 30 flux intégrés pour le texte, les images, la vidéo et les nuages de points 3D. Vous gérez vos flux d'étiquetage des données et la qualité de l'étiquetage des données Les experts AWS mettent en place des flux et les gèrent en votre nom conformément à vos exigences de qualité et de délai de traitement.
    Utilisateur Scientifiques des données et ingénieurs en ML Scientifiques des données, Ingénieurs en ML, Responsables des opérations de données et Responsables de programme
    Main-d'œuvre Votre choix : fournisseurs tiers, Amazon Mechanical Turk ou votre propre main-d'œuvre privée Une main-d'œuvre experte qui peut vous aider à répondre à vos exigences en matière de sécurité, de confidentialité et de conformité des données 
    Techniques d'étiquetage de ML  Apprentissage actif  Apprentissage actif, pré-étiquetage et validation automatique 

Avantages

Améliorer la qualité des jeux de données d'entraînement

Les offres d'étiquetage de données Amazon SageMaker fournissent des techniques d'étiquetage ML qui sont moins sujettes aux erreurs manuelles et aident à améliorer la qualité des jeux de données d'entraînement. Amazon SageMaker Ground Truth Plus dispose d'un flux d'étiquetage en plusieurs étapes qui comprend des modèles ML pour le pré-étiquetage, la validation automatique de l'étiquetage humain pour détecter les erreurs et les étiquettes de mauvaise qualité, et des fonctions d'aide à l'étiquetage (par ex., instantanés cubiques 3D, prédiction du prochain élément dans étiquetage vidéo et outils de segmentation automatique). Si vous gérez vos propres flux d'étiquetage des données, SageMaker Ground Truth fournit des fonctions d'étiquetage automatisées telles que le segmentation automatique, les instantanés cubiques 3D automatiques et la fusion de capteurs avec des trames vidéo 2D.  De plus, SageMaker Ground Truth fournit un étiquetage automatique des données qui utilise l'apprentissage actif et n'achemine les données étiquetées aux humains que si le modèle ne peut pas les étiqueter en toute confiance.

Choisir votre main-d'œuvre d'étiquetage de données

Avec les offres d'étiquetage de données Amazon SageMaker, vous pouvez choisir votre main-d'œuvre d'étiquetage de données. Avec SageMaker Ground Truth Plus, une main-d'œuvre experte formée aux tâches de ML étiquette vos données conformément à vos exigences en matière de qualité et de délai de traitement. Avec SageMaker Ground Truth, vous disposez d’options pour travailler avec des étiqueteurs au sein et en dehors de votre organisation. Vous pouvez envoyer facilement des tâches d'étiquetage à vos propres étiqueteurs ou vous pouvez également accéder à un effectif de plus de 500 000 entrepreneurs indépendants qui effectuent déjà des tâches liées au ML via Amazon Mechanical Turk. Si vos données requièrent une confidentialité ou des compétences particulières, vous pouvez aussi faire appel à des fournisseurs qui sont présélectionnés par AWS pour les procédures de qualité et de sécurité.

Augmenter la visibilité des opérations d'étiquetage des données

Les offres d'étiquetage des données Amazon SageMaker vous permettent d'obtenir une transparence dans les opérations d'étiquetage des données et la gestion de la qualité, afin que vous puissiez vérifier que vos exigences en matière de qualité sont respectées. SageMaker Ground Truth Plus fournit des tableaux de bord interactifs et des interfaces utilisateur. Ce processus vous permet donc d'examiner la progression des jeux de données d'entraînement sur plusieurs projets, de suivre les métriques du projet telles que le débit quotidien, d'inspecter les étiquètes pour en vérifier la qualité et de fournir des commentaires sur les données étiquetées.

Recevoir rapidement des données étiquetées de haute qualité

Avec les offres d'étiquetage de données Amazon SageMaker, vous pouvez recevoir rapidement des données étiquetées de haute qualité. Avec SageMaker Ground Truth Plus, vous chargez simplement vos données dans Amazon S3 avec les exigences en matière de sécurité, de confidentialité et de conformité. Les experts AWS configureront ensuite le flux d'étiquetage des données et une main-d'œuvre experte effectuera vos tâches d'étiquetage.

Démarrage avec Amazon SageMaker Ground Truth Plus