Questions d'ordre général

Q : Qu’est-ce que Amazon SageMaker Ground Truth ?

R : Amazon SageMaker Ground Truth vous permet d'étiqueter efficacement et avec précision les ensembles de données nécessaires à la formation de systèmes de machine learning. SageMaker Ground Truth peut automatiquement étiqueter une partie du jeu de données en fonction des étiquettes effectuées manuellement par des étiqueteurs humains. Vous pouvez choisir de faire appel à un effectif de plus de 500 000 étiqueteurs sur Amazon Mechanical Turk, à vos propres employés ou à l'un des fournisseurs tiers préalablement sélectionnés par Amazon répertoriés sur AWS Marketplace. SageMaker Ground Truth utilise des algorithmes et des techniques d'expérience utilisateur (UX) innovants pour améliorer la précision de l'étiquetage humain. Au fil du temps, le modèle s'améliore en apprenant continuellement à partir des étiquettes créées par les humains, ce qui permet un étiquetage automatique plus performant.

Q : Qu’est-ce que l’étiquetage de données automatique ?

R : L’étiquetage de données automatisé est l’étiquetage des données par machine learning. Amazon SageMaker Ground Truth sélectionnera d’abord un échantillon aléatoire de données et l’enverra à des humains pour qu’il soit étiqueté. Les résultats sont ensuite utilisés pour former un modèle d'étiquetage qui tente d'étiqueter automatiquement un nouvel échantillon de données brutes. Les étiquettes sont validées lorsque le modèle peut étiqueter les données avec un score de confiance égal ou supérieur à un seuil élevé. Lorsque le score de confiance tombe en dessous de ce seuil, les données sont envoyées aux étiqueteurs humains. Certaines des données étiquetées par les humains sont utilisées pour générer un nouvel ensemble de données de formation pour le modèle d'étiquetage. Le modèle est automatiquement reformé pour améliorer sa précision. Ce processus se répète avec chaque échantillon de données brutes à étiqueter. Le modèle d'étiquetage devient de plus en plus capable d'étiqueter automatiquement les données brutes à chaque itération, et moins de données sont ainsi acheminées vers les humains.

Utilisation de Amazon SageMaker Ground Truth

Q : Pourquoi utiliser Amazon SageMaker Ground Truth ?

R : Avant de créer, de former et de déployer des modèles de machine learning, vous avez besoin de données. Les modèles réussis reposent sur des données de formation de haute qualité. La collecte et l’étiquetage des jeux de données de formation nécessitent beaucoup de temps et d’efforts. Pour créer les jeux de données d'apprentissage, les étiqueteurs humains doivent évaluer un grand nombre d'images ou d'autres types de données, puis identifier et étiqueter des objets particuliers dans chaque type de données. Ces tâches d’étiquetage sont réparties sur de nombreux étiqueteurs humains, ce qui augmente considérablement les frais généraux et les coûts. S'il y a des étiquettes incorrectes, le système apprendra à partir des informations erronées et fera des prédictions inexactes.

Amazon SageMaker Ground Truth résout ce problème en facilitant la réalisation efficace d'un étiquetage de données extrêmement précis à l'aide de données stockées dans Amazon S3, avec une combinaison d'étiquetage de données automatisé et d'étiquetage effectué par des humains.

Q : Comment démarrer avec Amazon SageMaker Ground Truth ?

R : Amazon SageMaker Ground Truth fournit une expérience gérée dans laquelle vous pouvez configurer une tâche d'étiquetage de données complète en quelques étapes. Pour démarrer avec Amazon SageMaker Ground Truth, vous devez vous connecter à AWS Management Console et puis accéder à la console SageMaker. À partir de là, sélectionnez tâches d’étiquetage sous Ground Truth. Vous pouvez créer une tâche d’étiquetage à cet endroit. Tout d'abord, dans le cadre du processus de création d'une tâche d'étiquetage, vous fournissez un pointeur vers le compartiment S3 qui contient votre jeu de données à étiqueter. Ground Truth propose des modèles pour les tâches d'étiquetage courantes dans lesquelles il vous suffit de cliquer sur quelques choix et de fournir des instructions minimales sur la manière d’étiqueter leurs données. Vous pouvez également créer votre propre modèle personnalisé. Lors de la dernière étape de la création d’une tâche d’étiquetage, vous sélectionnez l’une des trois options de main-d’œuvre humaine : (1) une main-d’œuvre publique participative, (2) un ensemble de fournisseurs sélectionnés proposant des services d’étiquetage des données et (3) vos propres travailleurs. . Vous avez également la possibilité d'activer l'étiquetage automatisé des données.

Q : Comment mes ensembles de données de formation sont-ils gérés à l'aide d'Amazon SageMaker Ground Truth ?

R : Amazon SageMaker Ground Truth gère les métadonnées, les étiquettes associées et une taxonomie de vos étiquettes et de vos jeux de données. Vous pouvez facilement utiliser le kit SDK AWS via un bloc-notes SageMaker ou la console Ground Truth de la console SageMaker pour effectuer des requêtes et gérer vos jeux de données et vos étiquettes. Consultez la documentation Amazon SageMaker Ground Truth pour plus d'informations.

Q : Comment Amazon SageMaker Ground Truth aide-t-il à accroître la précision de mes jeux de données de formation ?

R : Amazon SageMaker Ground Truth offre les fonctionnalités suivantes pour aider les clients à accroître la précision de l'étiquetage de données effectué par des humains :

(a) Consolidation d’annotation : Cela neutralise les erreurs ou biais de travailleurs individuels en envoyant chaque objet de données à plusieurs travailleurs, puis en consolidant leurs réponses (appelées « annotations ») dans une seule étiquette. Il prend ensuite leurs annotations et les compare à l'aide d'un algorithme de consolidation d'annotation. Cet algorithme détecte d’abord les annotations aberrantes et ne les prend pas en compte. Il effectue ensuite une consolidation pondérée des annotations, en attribuant des pondérations plus élevées aux annotations plus fiables. La sortie est une étiquette unique pour chaque objet.

(b) Meilleures pratiques d’interface d’annotation : Ce sont des fonctionnalités des interfaces d'annotation qui permettent aux travailleurs d'exécuter leurs tâches avec plus de précision. Les travailleurs humains sont sujets à des erreurs et préjugés, et les interfaces bien conçues améliorent leur précision. L'une des meilleures pratiques consiste à afficher de brèves instructions ainsi que des exemples de bonnes et de mauvaises d'étiquette sur un panneau latéral fixe. Une autre meilleure pratique consiste à assombrir la zone située en dehors de la limite du cadre de délimitation lorsque les travaillent dessinent le cadre de délimitation sur une image.

Q : Comment Amazon SageMaker Ground Truth s’assure-t-il que mes données sont protégées et sécurisées ?

R : Par défaut, Amazon SageMaker Ground Truth chiffre vos données au repos et en transit. En outre, l'accès à vos données peut être contrôlé à l'aide d'AWS Identity and Access Management (IAM). Ground Truth ne stocke ni ne copie pas vos données en dehors de votre environnement AWS, et vos données restent sous votre contrôle. De plus, Ground Truth prend en charge les normes de conformité telles que le règlement général de protection des données (GDPR) et fournit des fonctionnalités complètes de journalisation et d'audit à l'aide d'Amazon CloudWatch et d'Amazon CloudTrail. Consultez la documentation Amazon SageMaker Ground Truth pour plus d'informations.  

Q: Comment puis-je accéder à une main-d'œuvre humaine à l'aide d'Amazon SageMaker Ground Truth ?

R : À partir de SageMaker Ground Truth, vous pouvez choisir l’une des trois options de main-d’œuvre, à savoir (1) une main-d’œuvre publique participative via Amazon Mechanical Turk; (2) des fournisseurs tiers disponibles via AWS Marketplace; et (3) vos propres employés. Consultez la documentation Amazon SageMaker Ground Truth pour plus d'informations.  

Prix et disponibilité

Q : Combien coûte Amazon SageMaker Ground Truth ?

R : Veuillez vous reporter à la page de tarification SageMaker Ground Truth pour obtenir les informations de tarification actuelles..

Q : Dans quelles régions AWS le service Amazon SageMaker Ground Truth est-il disponible ?

R : Amazon SageMaker Ground Truth est actuellement disponible dans les régions AWS suivantes : Virginie du Nord, Ohio, Oregon, Irlande et Tokyo.

Product-Page_Standard-Icons_01_Product-Features_SqInk
En savoir plus sur la tarification d’Amazon SageMaker Ground Truth

Démarrage avec Amazon SageMaker Ground Truth sans engagement ou contrat à long-terme. Pour plus de détails, consultez la page de tarification Amazon SageMaker Ground Truth.

Product-Page_Standard-Icons_02_Sign-Up_SqInk
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Commencez à créer sur la console

Commencez à créer avec Amazon SageMaker Ground Truth dans AWS Management Console.

Se connecter