Questions d'ordre général

Q : Qu’est-ce que Amazon SageMaker Ground Truth ?

R : Amazon SageMaker Ground Truth vous permet d'étiqueter efficacement et avec précision les ensembles de données nécessaires à la formation de systèmes de machine learning. SageMaker Ground Truth peut automatiquement étiqueter une partie du jeu de données en fonction des étiquettes effectuées manuellement par des étiqueteurs humains. Vous pouvez choisir de faire appel à un effectif de plus de 500 000 étiqueteurs sur Amazon Mechanical Turk, à vos propres employés ou à l'un des fournisseurs de service d'étiquetage de données tiers répertoriés sur AWS Marketplace et sélectionnés préalablement par Amazon. SageMaker Ground Truth utilise des algorithmes et des techniques d'expérience utilisateur (UX) innovants pour améliorer la précision de l'étiquetage humain. Au fil du temps, le modèle s'améliore en apprenant continuellement à partir des étiquettes créées par les humains, ce qui permet un étiquetage automatique plus performant.

Q : Qu’est-ce que l’étiquetage de données automatique ?

R : L’étiquetage de données automatisé est l’étiquetage des données par machine learning. Amazon SageMaker Ground Truth sélectionnera d’abord un échantillon aléatoire de données et l’enverra à des humains pour qu’il soit étiqueté. Les résultats sont ensuite utilisés pour former un modèle d'étiquetage qui tente d'étiqueter automatiquement un nouvel échantillon de données brutes. Les étiquettes sont validées lorsque le modèle peut étiqueter les données avec un score de confiance égal ou supérieur à un seuil élevé. Lorsque le score de confiance tombe en dessous de ce seuil, les données sont envoyées aux étiqueteurs humains. Certaines des données étiquetées par les humains sont utilisées pour générer un nouvel ensemble de données de formation pour le modèle d'étiquetage. Le modèle est automatiquement reformé pour améliorer sa précision. Ce processus se répète avec chaque échantillon de données brutes à étiqueter. Le modèle d'étiquetage devient de plus en plus capable d'étiqueter automatiquement les données brutes à chaque itération, et moins de données sont ainsi acheminées vers les humains.

Utilisation de Amazon SageMaker Ground Truth

Q : Pourquoi utiliser Amazon SageMaker Ground Truth ?

R : Avant de créer, de former et de déployer des modèles de machine learning, vous avez besoin de données. Les modèles réussis reposent sur des données de formation de haute qualité. La collecte et l’étiquetage des jeux de données de formation nécessitent beaucoup de temps et d’efforts. Pour créer les jeux de données d'apprentissage, les étiqueteurs humains doivent évaluer un grand nombre d'images ou d'autres types de données, puis identifier et étiqueter des objets particuliers dans chaque type de données. Ces tâches d’étiquetage sont réparties sur de nombreux étiqueteurs humains, ce qui augmente considérablement les frais généraux et les coûts. S'il y a des étiquettes incorrectes, le système apprendra à partir des informations erronées et fera des prédictions inexactes.

Amazon SageMaker Ground Truth résout ce problème en facilitant la réalisation efficace d'un étiquetage de données extrêmement précis à l'aide de données stockées dans Amazon S3, avec une combinaison d'étiquetage de données automatisé et d'étiquetage effectué par des humains.

Q : Comment démarrer avec Amazon SageMaker Ground Truth ?

R : Amazon SageMaker Ground Truth fournit une expérience gérée dans laquelle vous pouvez configurer une tâche d'étiquetage de données complète en quelques étapes. Pour démarrer avec Amazon SageMaker Ground Truth, vous devez vous connecter à AWS Management Console, puis accédez à la console SageMaker. À partir de là, sélectionnez tâches d'étiquetage sous Ground Truth. Vous pouvez créer une tâche d’étiquetage à cet endroit. Tout d'abord, dans le cadre du processus de création d'une tâche d'étiquetage, vous fournissez un pointeur vers le compartiment S3 qui contient votre jeu de données à étiqueter. Ground Truth propose des modèles pour les tâches d'étiquetage courantes dans lesquelles il vous suffit de cliquer sur quelques choix et de fournir des instructions minimales sur la manière d'étiqueter vos données. Vous pouvez également créer votre propre modèle personnalisé. Lors de la dernière étape de la création d'une tâche d'étiquetage, vous sélectionnez l'une des trois options de main-d'œuvre humaine : (1) une main-d'œuvre publique participative, (2) un ensemble de fournisseurs de services tiers d'étiquetage de données sélectionnés, ou (3) vos propres employés. Vous avez également la possibilité d'activer l'étiquetage automatisé des données.

Q : Comment mes ensembles de données de formation sont-ils gérés à l'aide d'Amazon SageMaker Ground Truth ?

R : Amazon SageMaker Ground Truth gère les métadonnées, les étiquettes associées et une taxonomie de vos étiquettes et de vos jeux de données. Vous pouvez facilement utiliser le kit SDK AWS via un bloc-notes SageMaker ou la console Ground Truth de la console SageMaker pour effectuer des requêtes et gérer vos jeux de données et vos étiquettes. Consultez la documentation Amazon SageMaker Ground Truth pour plus d'informations.

Q : Comment Amazon SageMaker Ground Truth aide-t-il à accroître la précision de mes jeux de données de formation ?

R : Amazon SageMaker Ground Truth offre les fonctionnalités suivantes pour vous aider à accroître la précision de l'étiquetage de données effectué par des humains :

(a) Consolidation d'annotation : Cela neutralise les erreurs ou biais de travailleurs individuels en envoyant chaque objet de données à plusieurs travailleurs, puis en consolidant leurs réponses (appelées « annotations ») dans une seule étiquette. Il prend ensuite leurs annotations et les compare à l'aide d'un algorithme de consolidation d'annotation. Cet algorithme détecte d’abord les annotations aberrantes et ne les prend pas en compte. Il effectue ensuite une consolidation pondérée des annotations, en attribuant des pondérations plus élevées aux annotations plus fiables. La sortie est une étiquette unique pour chaque objet.

(b) Meilleures pratiques d’interface d’annotation : Ce sont des fonctionnalités des interfaces d'annotation qui permettent aux travailleurs d'exécuter leurs tâches avec plus de précision. Les travailleurs humains sont sujets à des erreurs et préjugés, et les interfaces bien conçues améliorent leur précision. L'une des meilleures pratiques consiste à afficher de brèves instructions ainsi que des exemples de bonnes et de mauvaises d'étiquette sur un panneau latéral fixe. Une autre meilleure pratique consiste à assombrir la zone située en dehors de la limite du cadre de délimitation lorsque les travaillent dessinent le cadre de délimitation sur une image.

Q : Comment Amazon SageMaker Ground Truth s’assure-t-il que mes données sont protégées et sécurisées ?

R : Par défaut, Amazon SageMaker Ground Truth chiffre vos données au repos et en transit. En outre, l'accès à vos données peut être contrôlé à l'aide d'AWS Identity and Access Management (IAM). Ground Truth ne stocke ni ne copie pas vos données en dehors de votre environnement AWS, et vos données restent sous votre contrôle. De plus, Ground Truth prend en charge les normes de conformité telles que le règlement général sur la protection des données (RGPD) et fournit des fonctionnalités complètes de journalisation et d'audit à l'aide d'Amazon CloudWatch et d'Amazon CloudTrail. Consultez la documentation Amazon SageMaker Ground Truth pour plus d'informations.

Q : Comment puis-je accéder à une main-d'œuvre humaine à l'aide d'Amazon SageMaker Ground Truth ?

R : À partir de SageMaker Ground Truth, vous pouvez choisir l'une des trois options de main-d'œuvre, à savoir (1) une main-d'œuvre publique participative via Amazon Mechanical Turk; (2) des fournisseurs de service d'étiquetage des données tiers disponibles via AWS Marketplace; et (3) vos propres employés. Consultez la documentation Amazon SageMaker Ground Truth pour plus d'informations.  

Q :   Le fournisseur de service d'étiquetage des données Amazon SageMaker Ground Truth peut-il traiter les données confidentielles ?

R : Oui, le fournisseur de service d’étiquetage des données Amazon SageMaker Ground Truth peut traiter les données confidentielles. Le contrat de service standard entre les clients AWS et le fournisseur de service d'étiquetage de données tiers contient des protections de base pour les informations confidentielles.. Veuillez lire ces conditions avant de partager des informations confidentielles avec le fournisseur de service. Les conditions se trouvent sur la page répertoriant les fournisseurs de service sur AWS Marketplace.

Q :   Quelles normes de sécurité les fournisseurs de service d'étiquetage des données Amazon SageMaker Ground Truth doivent-ils respecter ?

A :  Les fournisseurs de services d’étiquetage des données sont tenus de se soumettre à la conformité et à la certification SOC 2 sur une base annuelle. Le rapport SOC 2 décrit l’environnement de contrôle du fournisseur de service en fonction des critères de service de confiance de l’American Institute of Certified Public Accountants (AICPA) : sécurité, disponibilité, intégrité du traitement et confidentialité.

Outre SOC 2, les fournisseurs de service sont tenus de mettre en place ces contrôles de sécurité supplémentaires afin de protéger les données des clients.

Contrôles technologiques :
Les fournisseurs de service sont tenus d'utiliser le logiciel approprié pour bloquer toute tentative de téléchargement ou de copie des fichiers/données à partir de leurs systèmes et empêcher tout accès non autorisé à leurs systèmes. Ils sont également tenus d'interdire à leur personnel de stocker ou de copier les données relatives aux tâches du client.

Contrôles de sécurité du réseau :
Le réseau du fournisseur de service doit être capable d'empêcher l'accès à distance aux données relatives à vos tâches. En outre, les logiciels de partage de fichiers entre pairs sont bloqués sur le réseau du fournisseur, et le pare-feu doit être conçu de manière à offrir une haute disponibilité.

Contrôles des employés :
Les fournisseurs de service sont tenus de faire signer à leurs employés des accords de non-divulgation. Les fournisseurs de service sont tenus d’adopter des règles strictes pour empêcher toute fuite d’informations, et leurs employés de transmettre des informations par quelque moyen que ce soit : papier, clés USB, téléphones portables ou tout autre médiat.

Contrôles des accès physiques :
Les fournisseurs de service sont tenus de mettre en place des mesures de contrôle des accès physiques afin d'empêcher tout accès non autorisé à leur site de production. Il peut s’agir de tourniquets avec authentification biométrique, identification de badge d'employé, etc.

Q :   Comment AWS aide-t-il les fournisseurs de service à respecter ces normes de sécurité ?

A :  AWS demande aux fournisseurs de service de fournir leurs rapports de certification SOC 2 avant de figurer sur le marketplace et confirme :

l’authenticité (si l’auditeur du fournisseur de service est certifié par l’AICPA) ;

la période de rapport (date de validité de la certification SOC 2) ;

le site de production (le site physique où le personnel du fournisseur de service travaillera sur les tâches d'étiquetage Amazon SageMaker Ground Truth).

Q :   Quelle est la fréquence de vérification des normes de sécurité du fournisseur de service ?

R :  Les normes de sécurité de chaque fournisseur de services sont vérifiées tous les ans afin de s'assurer qu'elles remplissent bien les exigences obligatoires.

Q :   Existe-t-il des exceptions à la vérification AWS ?

R :  Non. Si le fournisseur de service ne respecte pas les normes de sécurité, sa liste est supprimée d'AWS Marketplace. La liste sera supprimée dans les 24 heures et tous les clients actifs seront informés par e-mail.

Q :   Si le fournisseur de service propose des services d'étiquetage de données via plusieurs sites de production, tous les sites doivent-ils passer par le processus de vérification ?

A :  Oui, tous les sites doivent respecter les normes de sécurité requises.

Q :   Que se passe-t-il en cas de violation de données sur le site de production du fournisseur de service ?

A : Le fournisseur de services devra informer AWS et les clients concernés dans les 24 heures consécutives à la détection de tout accès, collecte, acquisition, utilisation, transmission, divulgation non autorisés, et de tout endommagement ou perte d'informations du client, que ces incidents soient réels ou présumés. Le fournisseur de service devra résoudre rapidement chaque incident de sécurité et fournir à AWS et aux clients concernés des informations écrites sur l'enquête interne.

Utilisation de fournisseurs de service d'étiquetage des données tiers

Q :   Le fournisseur de service d'étiquetage des données Amazon SageMaker Ground Truth peut-il traiter les données confidentielles ?

R : Oui, le fournisseur de service d’étiquetage des données Amazon SageMaker Ground Truth peut traiter les données confidentielles. Le contrat de service standard entre les clients AWS et le fournisseur de service d'étiquetage de données tiers contient des protections de base pour les informations confidentielles.. Veuillez lire ces conditions avant de partager des informations confidentielles avec le fournisseur de service. Les conditions se trouvent sur la page répertoriant les fournisseurs de service sur AWS Marketplace.

Q :   Quelles normes de sécurité les fournisseurs de service d'étiquetage des données Amazon SageMaker Ground Truth doivent-ils respecter ?

A :  Les fournisseurs de services d’étiquetage des données sont tenus de se soumettre à la conformité et à la certification SOC 2 sur une base annuelle. Le rapport SOC 2 décrit l’environnement de contrôle du fournisseur de service en fonction des critères de service de confiance de l’American Institute of Certified Public Accountants (AICPA) : sécurité, disponibilité, intégrité du traitement et confidentialité.

Outre SOC 2, les fournisseurs de service sont tenus de mettre en place ces contrôles de sécurité supplémentaires afin de protéger les données des clients.

Contrôles technologiques :
Les fournisseurs de service sont tenus d'utiliser le logiciel approprié pour bloquer toute tentative de téléchargement ou de copie de fichiers.données à partir de leur système et d’empêcher tout accès non autorisé à leurs systèmes. Ils sont également tenus d'interdire à leur personnel de stocker ou de copier les données relatives aux tâches du client.

Contrôles de sécurité du réseau :
Le réseau du fournisseur de service doit être capable d’empêcher l’accès à distance aux données relatives aux tâches du client. En outre, les logiciels de partage de fichiers entre pairs sont bloqués sur le réseau du fournisseur, et le pare-feu doit être conçu de manière à offrir une haute disponibilité.

Contrôles des employés :
Les fournisseurs de service sont tenus de faire signer à leurs employés des accords de non-divulgation. Les fournisseurs de service sont tenus d’adopter des règles strictes pour empêcher toute fuite d’informations, et leurs employés de transmettre des informations par quelque moyen que ce soit : papier, clés USB, téléphones portables ou tout autre médiat.

Contrôles des accès physiques :
Les fournisseurs de service sont tenus de mettre en place des mesures de contrôle des accès physiques afin d'empêcher tout accès non autorisé à leur site de production. Il peut s’agir de tourniquets avec authentification biométrique, identification de badge d'employé, etc.

Q :   Comment AWS aide-t-il les fournisseurs de service à respecter ces normes de sécurité ?

A :  AWS demande aux fournisseurs de service de fournir leurs rapports de certification SOC 2 avant de figurer sur le marketplace et confirme :

l’authenticité (si l’auditeur du fournisseur de service est certifié par l’AICPA) ;

la période de rapport (date de validité de la certification SOC 2) ;

le site de production (le site physique où le personnel du fournisseur de service travaillera sur les tâches d'étiquetage Amazon SageMaker Ground Truth).

Q :   Quelle est la fréquence de vérification des normes de sécurité du fournisseur de service ?

A :  Les fournisseurs de services sont contrôlés tous les ans afin de déterminer s'ils continuent de respecter les normes de sécurité.

Q :   Existe-t-il des exceptions à la vérification AWS ?

R :  Non. Si le fournisseur de service ne respecte pas les normes de sécurité, sa liste est supprimée d'AWS Marketplace. La liste sera supprimée dans les 24 heures et tous les clients actifs seront informés par e-mail.

Q :   Si le fournisseur de service propose des services d'étiquetage de données via plusieurs sites de production, tous les sites doivent-ils passer par le processus de vérification ?

A :  Oui, tous les sites doivent respecter les normes de sécurité requises.

Q :   Que se passe-t-il en cas de violation de données sur le site de production du fournisseur de service ?

A : Le fournisseur de services informera AWS et les clients concernés dans les 24 heures consécutives à la détection de tout accès, collecte, acquisition, utilisation, transmission, divulgation non autorisés, et de tout endommagement ou perte d’informations du client, que ces incidents soient réels ou présumés. Le fournisseur de service devra résoudre rapidement chaque incident de sécurité et fournir à AWS et aux clients concernés des informations écrites sur l'enquête interne.

Tarification et disponibilité

Q : Combien coûte Amazon SageMaker Ground Truth ?

R : Veuillez vous reporter à la page de tarification SageMaker Ground Truth pour obtenir les informations de tarification actuelles.

Q : Dans quelles régions AWS le service Amazon SageMaker Ground Truth est-il disponible ?

R : Amazon SageMaker Ground Truth est actuellement disponible dans les régions AWS suivantes : Virginie du Nord, Ohio, Oregon, Irlande, Tokyo et Sydney.

Product-Page_Standard-Icons_01_Product-Features_SqInk
En savoir plus sur la tarification d'Amazon SageMaker Ground Truth

Démarrage avec Amazon SageMaker Ground Truth sans engagement ou contrat à long-terme. Pour plus de détails, consultez la page de tarification Amazon SageMaker Ground Truth.

Product-Page_Standard-Icons_02_Sign-Up_SqInk
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Commencez à créer sur la console

Commencez à créer avec Amazon SageMaker Ground Truth dans AWS Management Console.

Se connecter