Amazon SageMaker Ground Truth

Créez des ensembles de données de formation très précis et réduisez les coûts d'étiquetage des données jusqu'à 70 % à l'aide du machine learning.

Amazon SageMaker Ground Truth vous aide à créer rapidement des jeux de données de formation extrêmement précis pour le machine learning. SageMaker Ground Truth offre un accès facile aux étiqueteurs humains publiques et privées et leur fournit des flux de travail intégrés et des interfaces pour les tâches d'étiquetage courantes. De plus, SageMaker Ground Truth peut réduire vos coûts d’étiquetage jusqu’à 70% en utilisant l’étiquetage automatique, qui consiste à former Ground Truth à partir de données étiquetées par des humains afin que le service apprenne à étiqueter les données de manière indépendante.

Les modèles de machine learning performants reposent sur de larges volumes de données de formation de haute qualité. Cependant, le processus de création des données de formation nécessaires à la construction de ces modèles est souvent coûteux, compliqué et prend beaucoup de temps. La majorité des modèles créés aujourd'hui nécessitent un utilisateur pour étiqueter manuellement les données de manière à lui permettre d'apprendre à prendre les bonnes décisions. Par exemple, la création d'un système de vision par ordinateur suffisamment fiable pour identifier des objets - tels que des feux de circulation, des panneaux de signalisation et des piétons - nécessite des milliers d'heures d'enregistrements vidéo comprenant des centaines de millions d'images vidéo. Chacune de ces images vidéo nécessite que tous les éléments importants, tels que la route, les autres voitures et la signalisation, soient étiquetés par un humain avant de commencer à travailler sur le modèle que vous souhaitez développer.

Amazon SageMaker Ground Truth réduit considérablement le temps et les efforts nécessaires pour créer des ensembles de données pour la formation afin de réduire les coûts. Ces économies sont réalisées en utilisant le machine learning pour étiqueter automatiquement les données. Le modèle peut s'améliorer progressivement avec le temps en apprenant continuellement à partir d'étiquettes créées par des étiqueteurs humains.

Lorsque le modèle d'étiquetage a une grande confiance dans ses résultats, sur la base de ce qu'il a appris jusqu'à présent, il appliquera automatiquement les étiquettes aux données brutes. Lorsque le modèle d'étiquetage a une confiance moindre dans ses résultats, il transmettra les données aux humains pour qu’ils effectuent l'étiquetage. Les étiquettes générées par les humains sont renvoyées dans le modèle d'étiquetage afin que celui-ci puisse apprendre et s'améliorer. Au fil du temps, SageMaker Ground Truth peut étiqueter de plus en plus de données automatiquement et considérablement accélérer la création de jeux de données d'apprentissage. 

Avantages

Réduisez les coûts d'étiquetage des données jusqu'à 70 %

SageMaker Ground Truth utilise un modèle de machine learning pour étiqueter automatiquement les données brutes afin de produire rapidement des jeux de données de formation de haute qualité, pour une fraction du coût de l’étiquetage manuel. Les données ne sont acheminées à l'humain que si le modèle d'apprentissage actif ne peut pas les étiqueter en toute confiance. Les données étiquetées par l'humain sont ensuite utilisées pour former le modèle afin d'améliorer ses capacités. Moins de données sont ensuite envoyées aux humains lors de la prochaine série d'étiquetage, ce qui réduit vos coûts. 

Travailler avec des étiqueteurs humains publics et privés

Vous pouvez choisir d'utiliser votre équipe d'étiqueteurs et leur acheminer directement les demandes d'étiquetage. D’autre part, si vous devez mettre à l’échelle votre système, des options sont fournies directement dans la console Amazon SageMaker Ground Truth afin de travailler avec des étiqueteurs à votre organisation. Vous pouvez accéder à un effectif public de plus de 500 000 étiqueteurs via l'intégration à Amazon Mechanical Turk. Si vos données nécessitent une confidentialité ou des compétences particulières, vous pouvez également faire appel à des sociétés d’étiquetage professionnelles présélectionnées par Amazon.

Obtenez rapidement des résultats précis

Amazon SageMaker Ground Truth permet de créer rapidement des ensembles de données de formation de haute qualité et précis. Les étiquettes générées par machine fournissent des résultats cohérents avec un score de confiance pour chaque étiquette, de sorte que vous puissiez facilement comprendre le niveau de certitude de l’étiquette fournie par le service. Les résultats étiquetés par l'utilisateur sont automatiquement évalués en fonction des critères que vous fournissez pour vous assurer que davantage de données sont envoyées aux étiqueteurs de qualité supérieure et que les étiqueteurs de qualité médiocre sont dé-accentués.

Fonctionnement

Product-Page-Diagram_SamurAI_How-it-works-2
Product-Page_Standard-Icons_01_Product-Features_SqInk
Découvrez les fonctionnalités d’Amazon SageMaker Ground Truth

Reportez-vous à la documentation pour savoir comment Amazon SageMaker Ground Truth peut vous aider à créer des ensembles de données de formation de haute qualité avec la précision la plus élevée et vous aider à réduire les coûts de données d'étiquetage de jusqu'à 70 %.

Product-Page_Standard-Icons_02_Sign-Up_SqInk
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Commencez à créer sur la console

Commencez à créer avec Amazon SageMaker Ground Truth dans AWS Management Console.

Se connecter