Amazon SageMaker Ground Truth vous aide à créer des ensembles de données de formation pour le machine learning. Ground Truth étiquette votre contenu (images, audio, texte, etc.) en guidant pas à pas un étiqueteur humain tout au long d’un processus appelé flux de travail. Trois groupes d’individus peuvent attribuer des étiquettes via ces flux de travail : les employés Amazon Mechanical Turk, vos employés ou les fournisseurs tiers. Ground Truth peut également tirer un enseignement de ces étiquettes afin d’étiqueter automatiquement les objets.
Vous payez pour chaque objet étiqueté (une image, un enregistrement audio, une portion de texte, etc.), qu’il l’ai été automatiquement par Ground Truth ou par un étiqueteur humain. Si vous passez par un fournisseur ou Mechanical Turk pour l’attribution d’étiquettes, des frais supplémentaires vous seront facturés pour chaque objet étiqueté. Si vos employés se chargent d’étiqueter vos objets, aucuns frais supplémentaires ne vous seront facturés.
Informations de tarification
Vous êtes facturé pour le nombre d'objets d’ensemble de données étiquetés. Un objet d'ensemble de données est défini comme une unité atomique de données et peut inclure des images, des trames vidéo, des documents texte, des fichiers audio, etc.
Nuages de points
Tarification intégrée du flux de travail pour l'étiquetage avec Amazon Mechanical Turk
Le coût par étiquette est fixé par le fournisseur si vous utilisez un fournisseur. Vous pouvez consulter les informations de tarification de chaque fournisseur sur AWS Marketplace. Si vous passez par Amazon Mechanical Turk pour l'étiquetage, vous payez par objet et par étiqueteur. Nous vous recommandons d'utiliser plusieurs étiqueteurs par objet pour améliorer la précision d'étiquetage.
Offre gratuite
Dans le cadre de l'offre gratuite d'AWS, vous pouvez commencer à utiliser Amazon SageMaker Ground Truth gratuitement. Pendant les deux premiers mois suivant la première utilisation d'Amazon SageMaker, vos 500 premiers objets étiquetés de chaque mois sont gratuits (à l'exception des frais supplémentaires induits par l'étiquetage par un fournisseur tiers ou via Amazon Mechanical Turk).
Exemples de tarification
Utilisation des employés internes pour l'étiquetage humain
Une entreprise de fabrication utilise le machine learning pour classer les images de ses produits. Pour entraîner son modèle, elle étiquette 40 000 images avec des noms de produits. Pour ce faire, ses employés utilisent un flux de travail intégré pour la classification d’images.
Puisque l’entreprise a utilisé ses propres employés, le prix de chacune des 40 000 images étiquetées sera de 0,08 USD.
Coût total = 40 000 images étiquetées par des humains x 0,08 USD par image = 3 200 USD
Utilisation de Mechanical Turk pour l'étiquetage humain avec flux de travail personnalisé
Une agence de publicité utilise le machine learning pour déterminer les opinions et le contenu liés aux publications sur les réseaux sociaux. Pour entraîner son modèle, elle décide d’étiqueter 85 000 publications. Elle décide de créer et de charger un flux de travail personnalisé et de définir un paiement de 0,036 USD par publication. Elle souhaite également étiqueter 3 fois chaque publication afin d’améliorer la précision des étiquettes. 85 000 publications sont étiquetées par des humains via SageMaker Ground Truth.
Étant donné que l’entreprise utilise Mechanical Turk, le coût comprend des frais supplémentaires de 0,036 USD par publication étiquetée par un humain pour payer l’étiqueteur.
Coût total = (50 000 x 0,08 USD par article) + (35 000 publications x 0,04 USD) + (85 000 publications étiquetées par un humain x 0,036 USD par publication x 3 étiqueteurs par objet) = 14 580 USD
Utilisation de Mechanical Turk pour l'étiquetage humain avec flux de travail intégré
Une maison d'édition utilise le machine learning afin de créer une application de traitement du langage naturel pour classer des articles de journaux. Pour entraîner son modèle, elle étiquette 200 000 articles. Elle opte pour un flux de travail intégré avec classification du texte et décide d’étiqueter chaque article 3 fois, de façon à améliorer la précision de l’étiquetage. 40 000 articles sont étiquetés par des humains via SageMaker Ground Truth et 160 000 le sont automatiquement.
Étant donné que l’entreprise utilise Mechanical Turk, le flux de travail avec classification du texte implique des frais supplémentaires de 0,012 USD par article étiqueté par un humain afin de payer l’étiqueteur.
Coût total = (50 000 x 0,08 USD par article) + (150 000 articles x 0,04 USD par article) + (40 000 articles étiquetés par un humain x 0,012 USD par article x 3 étiqueteurs par objet) + Formation et inférence des coûts** Amazon SageMaker = 11 440 USD + Formation et inférence des coûts** Amazon SageMaker
**Ces coûts sont fonction de plusieurs facteurs, dont le type d'ensemble de données utilisé, le type de tâche d'étiquetage et la résolution des images de votre ensemble de données.
Ressources de tarification supplémentaires
Calculez simplement vos coûts mensuels avec AWS
Ressources supplémentaires pour le passage à AWS

Découvrez comment Amazon SageMaker Ground Truth peut vous aider à créer des ensembles de données de formation de qualité et précision optimales, tout en réduisant les coûts d'étiquetage des données jusqu'à 70 %.

Commencez à créer avec Amazon SageMaker Ground Truth dans AWS Management Console.